What are my chances to talk to this girl? Fisher or Bayes


Robert Mathews said that : “Ronald Fisher gave scientists a mathematical machine for turning baloney into breakthroughs, and ukes into funding. It is time to pull the plug.”. He’s right. In one previous life, I wrote a thesis in Philosophy. But, a specific area, Epistemology also calledtheory of knowledge, because, It questions ...

Classifieur Naïf Bayésien


IntroductionLe classifieur naïf bayésien est l’une des méthodes les plus simples en apprentissage supervisé basée sur le théorème de Bayes. il est peu utilisé par les praticiens du data mining au détriment des méthodes traditionnelles que sont les arbres de décision ou les régressions logistiques.Un avantage de cette méthode est la...

Ce que je sais sur les séries temporelles (1/5)


Ce que je sais sur les séries temporelles (1/5) En lisant la préface de Flore Vasseur à l'essai “le monde en 2030 vu par la CIA”, j'ai été très frappé par mon manque de culture macroéconomique. En effet, un essaiqui parle de 2030, regorge presqu'essentiellement de prévisions macroéconomiques basées sur des scenarii plus ou moins lo...

Construire un moteur de reco simple avec R (1/2)


Construire un moteur de rechercheOn va montrer comment on peut construire un moteur de recommandation simple en utilisant les outils de Textmining. Cette construction se fera en deux temps : On construit un moteur de recherche pour identifier par exemple, dans la base de données les éléments les plus proches de sa requêteOn applique un mod�...

Road for Data Scientist by Swami


Read away, A interesting post about skills to become Data Scientist.The post is about  Where to start? When do you start seeing light at the end of the tunnel? What is the learning roadmap? What tools and techniques do I need to know?  How can I stay aware of new features or new techniques? How can I switch between different area of knowledge...

Myown way to Data Science


In my last post, I point the Road to data science, imagined by Swami. I think this road is too long and we can’t make any difference  between the basics (we have to know) and the advanced(it’s important to know, bu if not, it doesn’t matter).So I’ve imagined my own way to be efficient, from Fundamentals to advanced skills to ...

Les k-plus prcoches voisins :Vite, il faut se la réapproprier…


K-plus proches voisins K-plus proches voisins Fondamentaux La notion de voisinage d'un point est assez intuitive. Une définition simple serait : une zone de l'espace qui comprend ce point. C'est une notion centrale en mathématique, particulièrement en analyse lorsqu'on souhaite unifier la notion de finitide (calcul de limites) d'un espace mét...

Hadoop for R’s Data scientist


I don’t exactly know where to start. But, after a real pleasant discussion with one of my ex colleague, it seems that there are many thongs around Hadoop ecosystem and R for analyst that should be said by a data scientist, means that, someone who don’t know much more about big data architecture, but who should know the essentials ...

Sochi 2014, R, D3.js


Ramnath design rCharts wich combine the powerful of open source R and D3.js.It give very pretty plots. Here is some code, using package XML to collect the data from and plot a kind of sankey diagram with rCharts@Ramnath wrote this :

