Dataiku ouvre plus largement sa plateforme de data science d'entreprise. Après en avoir sorti une déclinaison online pour les petites équipes des start-ups et PME, l’éditeur français - qui a encore levé 350 M€ cet été et porté sa valorisation à 4 Md€ - a introduit dans sa version 10 davantage de capacités pour engager dans les projets analytiques et d’intelligence artificielle une diversité de profils et de rôles. Pour qu’une organisation puisse adopter une approche plus systématique sur le développement et la mise en oeuvre des projets d’IA déployés à grande échelle, il lui faut inclure parmi les contributeurs les équipes opérationnelles, les chefs de projets, les gestionnaires de risque et les experts métiers, pointe Dataiku sur son blog. « Avec Dataiku 10, les data scientists et les opérateurs IT disposent d’outils additionnels et de davantage de flexibilité pour déployer, monitorer et gérer les modèles d’apprentissage machine à grande échelle ».

La version 10 intègre des outils de surveillance et d’alerte des dérives sur les modèles d’apprentissage machine passés à l’échelle. Pour évaluer les modèles, elle dispose désormais d’un espace (model evaluation store) pour visualiser leurs performances dans le temps. Une fois qu’un modèle est développé et réentraîné, un outil de comparaison permet une évaluation visuelle et d’appliquer le test champion/challenger pour aider les développeurs à l’améliorer de façon continu et améliorer les workflows MLOps. Les étapes de livraison sont orchestrées de façon centralisée ce qui réduit les tâches liées à la surveillance manuelle des modèles ML et à leur maintenance. Par ailleurs, en dehors des modèles ML conçus nativement au sein de la plateforme, il est possible de déployer et gérer au sein de celle-ci les modèles conçus de façon externe dans MLFlow.

Model Evaluation Store, un espace où vérifier comment évoluent les performances des modèles d'apprentissage machine dans le temps. (Crédit : Dataiku)

Gouvernance : des capacités d'évaluation des risques

Sur les aspects de gouvernance, la version 10 s’enrichit de diverses fonctionnalités dont des workflows standardisés pour mettre en action les tâches analytiques les plus courantes et les différentes étapes des projets. Des capacités d’évaluation des risques et de la valeur des projets permettent de mieux déterminer l’investissement. Un référentiel consigne tous les modèles ML en un seul endroit avec leurs versions, métriques de performance et résumés des projets. Des outils permettent également d’assigner des tâches pour vérifier les modèles et de collecter les feedbacks.Dans Dataiku 10, on trouve aussi, avec les Workspaces, de nouveaux canaux de collaboration entre les équipes analytiques et les audiences auxquelles elles s’adressent. Dans cet espace privé, les consommateurs de données peuvent retrouver les actifs dont ils ont besoin à partir des différents projets conçus dans la plateforme. Cette dernière a par ailleurs étendu ses capacités sur la présentation visuelle des données statistiques, sur l’analyse géospatiale et sur les fonctions de visualisation. L’exploration et l’enrichissement des données s’en trouvent facilitées, de même que la distribution interactive des analyses aux utilisateurs métiers.

Des solutions métiers prêtes à l'emploi, à adapter

Enfin, des solutions verticales sont proposées par Dataiku pour plusieurs secteurs d’activité. Pour démarrer des projets, celles-ci apportent un cadre à adapter  en fonction de ses cas d’usage. Parmi ces solutions « plug and play », Market Basket Analysis pour la distribution de détail va aider à analyser les transactions réalisées avec clients, tandis que Real Estate Pricing, destiné aux agences immobilières, montre comment utiliser Dataiku pour prévoir le prix des biens en utilisant des données publiques.

Parmi les autres solutions métierss, l'une s’applique à l’analyse d’impact des actualités sur le cours de bourse d’une société, une autre porte sur l’agrégation automatique de documents non structurés pour accélérer l’analyse de sentiments sur les données sociales et environnementales. (Crédit : Dataiku / Agrandir l'image)

La société française Dataiku, co-fondée en France en 2013 par Florian Douetteau, son PDG, a largement investi d'autres marchés. Son siège social a été installé à New York il y a quelques années. Il est par ailleurs dans la liste des personnalités IT de l'année 2021 du Monde Informatique.