L’éditeur français Dataiku a livré cette semaine une offre entièrement administrée de sa plateforme de gestion centralisée des projets analytiques et de data science. Sa solution, qui permet en particulier de créer des modèles de machine learning et de préparer les jeux de données pour l'apprentissage, est utilisée dans de nombreuses entreprises. Mais elle requiert de disposer en interne des ressources informatiques pour gérer les infrastructures sur lesquelles se déploient la plateforme, on-premise ou dans le cloud. La version Online managée qui vient d'être livrée était donc fortement demandée par les clients, explique Louis-Philippe Kronek, DG de Dataiku Online, sur le blog de l’éditeur. Parmi les premières entreprises qui se sont intéressées à Dataiku Online, certaines ont déjà résolu certains problèmes sur l’ingestion de données et la suppression des silos et veulent maintenant développer des services d’apprentissage machine, indique le DG. Elles cherchent une plateforme de bout en bout pour l’analytique et la data science qui soit disponible sous la forme d’un service et puisse être utilisée par les différents profils qui doivent intervenir sur les données. 

La version Online de Dataiku dispose les mêmes fonctionnalités que la version installée. Elle présente une configuration spécifique pour les plus petites équipes pour une utilisation administrée. Parmi les retours des premiers utilisateurs, la capacité à pouvoir démarrer rapidement, quelques minutes pour l’ouverture du compte, quelques heures pour les premières connexions, est mise en avant. Il apparaît aussi que ces entreprises s’appuient par ailleurs entièrement sur des produits natifs cloud fournis en mode managé ou se connectent à des services SaaS.

Intégration avec Snowflake, Redshift et Big Query

Dataiku Online a été développé en un an. Parmi les technologies partenaires sur lesquelles l’offre s’appuie, l’intégration avec le datawarehouse cloud Snowflake a été approfondie (ce dernier a d’ailleurs investi dans la société française à travers sa branche capital risque). L’accès à Dataiku se fait en un clic depuis le Data Cloud de Snowflake pour créer des pipelines automatisés et développer des analyses prédictives. D’autres intégrations ont également été faites avec Redshift d'AWS et Big Query de Google. Sur la partie ETL, la version Online fonctionne avec les solutions de FiveTran, Matillion et xPlenty. Louis-Philippe Kronek rappelle que Dataiku a toujours fait en sorte de rester agnostique sur les technologies avec lesquelles il peut se combiner afin de permettre aux entreprises de pouvoir accéder à leurs données en un seul endroit.

Dataiku Online peut être testé gratuitement en ligne pendant 14 jours. Il permet de récupérer des données depuis des fichiers ou des databases SQL. Il fonctionne en mode collaboratif jusqu’à 10 utilisateurs. Sa tarification démarre à 499$ par mois. Pour rappel, la version à déployer sur des serveurs, on-premise ou dans le cloud (sur AWS, GCP ou Azure) peut monter elle jusqu’à 1000 utilisateurs.