Dataiku, qui propose une distribution Open Source basée sur Hadoop, a lancé en début d'année une plateforme logicielle taillée pour répondre aux besoins des data scientists. Baptisée Data Science Studio (DSS), cette dernière combine plusieurs briques dont des outils de gestion de données, de statistiques, de visualisation et d'analyse prédictive.

Dernièrement, la start-up a mis à disposition en téléchargement une version gratuite et non limitée dans le temps de DSS Community Edition qui s'adresse aussi bien aux analystes et data scientists qu'aux développeurs. La Community Edition s'installe directement sur l'ordinateur de l'utilisateur, actuellement sur Linux et prochainement sur Mac OS X. Sa limitation réside dans la taille des fichiers de données qui ne peut pas excéder 100 000 lignes.

Parmi les fonctionnalités de cet outil, on trouve le nettoyage, l'enrichissement et la modélisation des données, des fonctions de machine learning et d'analyse prédictive. En outre, les utilisateurs trouveront en exemple un projet de e-commerce comprenant 12 datasets et y découvriront notamment les sujets de ciblage et de personnalisation marketing, le tout accompagné de tutoriels, précise Florian Douetteau, CEO de Dataiku.