Avec Genie Ontology, Databricks apporte la logique métier aux agents IA

Le fournisseur en solutions data store a poussé en beta Genie Ontology pour apporter du contexte, des ontologies et des lexiques métiers aux agents IA. Une orientation qui nécessite une bonne gouvernance et un travail sur la qualité des données. Databricks doit également faire face à une forte concurrence dans ce domaine

Après les bases de données vectorielles, puis le RAG, la prochaine étape de l’IA d’entreprise prend forme : des couches contextuelles entre agents autonomes pour partager une compréhension commune d’un métier. Une vision que Databricks met en œuvre avec Genie Ontology, actuellement en beta. Ce dernier extrait automatiquement la logique métier à partir des données d’entreprise, des tableaux de bord, des requêtes, des pipelines, des documents et des applications, puis l’organise en un graphe dynamique que les agents IA peuvent utiliser pour comprendre le fonctionnement d’une entreprise. Présenté lors du Data + AI Summit de Databricks (du 15 au 18 juin à San Francisco), Genie Ontology utilise un système de classement inspiré du page rank de Google pour identifier les définitions métier les plus fiables au sein d’une société.

« Plutôt que de traiter toutes les sources de la même manière, le système prend en compte une variété de facteurs, notamment l’auteur de l’information, son degré d’utilisation, ses liens avec des ensembles de données et des ressources certifiés, ainsi que la date de sa dernière mise à jour, avant de déterminer sur quelle réponse un agent IA doit se baser », a déclaré Ali Ghodsi, CEO de Databricks, en ouverture de l’événement. Les entreprises peuvent également importer leurs propres lexiques [ensemble des mots et des locutions d'une langue] métier ou ontologies [définition d'un vocabulaire commun lisible par des machines] dans Genie Ontology via la plateforme Unity Catalog Semantics déjà existante de Databricks, a ajouté le dirigeant.

L'ontologie gage de cohérence mais pas infaillible

Selon les analystes, pour les DSI, une couche contextuelle unifiée, telle que Genie Ontology, améliorera considérablement la cohérence, la confiance et la gouvernance des déploiements IA en entreprise. « Une définition unique alimentant tous les agents permet d’éviter d’obtenir trois réponses différentes à une même question », explique Michael Leone, analyste principal chez Moor Insights and Strategy. « Les anciennes approches, telles que le RAG et la recherche vectorielle, se contentent de renvoyer tout ce qui ressemble à votre question, sans réellement comprendre votre activité. Une ontologie apporte à l’agent ce qu’un catalogue ne peut pas offrir : la signification de vos termes et la source à laquelle se fier », a ajouté Michael Leone.

Selon Ashish Chaturvedi, responsable de la recherche exécutive chez HFS Research, cette amélioration de la cohérence pourrait également renforcer la confiance, qui reste l’un des principaux freins à l’adoption de l’IA. « Une contextualisation qui fonde les réponses sur des définitions métier réglementées, dont la traçabilité remonte jusqu’à la source, s’attaque directement à ce déficit de confiance », assure Ashish Chaturvedi. De son côté, Michael Leone s’est montré plus prudent quant à l’argument de la confiance : « C’est une idée prometteuse, mais elle doit encore faire ses preuves avant que je ne m’y fie pour quoi que ce soit d’important. » Faisant écho à Michael Leone, Stephanie Walter, responsable de la practice IA chez Hyperframe Research, a souligné que les ontologies présentaient un maillon manquant : la vérification. « Les ontologies peuvent améliorer le contexte, mais elles ne garantissent pas que la réponse soit correcte. Un agent peut toujours extraire des données incomplètes, appliquer une logique erronée, ignorer des lignes, mal interpréter un workflow ou prendre la mauvaise décision. »

Eviter le piège d’un système de métadonnées obsolètes

Selon Michael Leone, ce déficit de vérification devient d’autant plus critique que la plupart des entreprises ne disposent pas des données ni de la maturité en matière de gouvernance nécessaires pour mettre en œuvre une couche de contextualisation dans le cadre de leurs déploiements IA : « Si vos données et votre gouvernance ne sont pas déjà en ordre, cela ne fera qu’accélérer le chaos existant. » Stéphanie Walter abonde en ce sens en soulignant qu’une ontologie ne peut à elle seule remédier à des définitions confuses, à une traçabilité insuffisante, à une appropriation floue ou à des autorisations fragmentées. Tout en pointant que la difficulté pour les DSI ne réside pas dans la création ponctuelle d’une ontologie, mais dans le maintien de son exactitude à mesure que l’activité évolue : « Les entreprises auront besoin d’une propriété claire des données et des indicateurs, d’une expertise métier, de processus de gouvernance et d’un moyen de résoudre les définitions contradictoires. Sinon, l’ontologie deviendra un énième projet de métadonnées obsolète, sous un nom plus sophistiqué », prévient Stéphanie Walter.

Au-delà d’une bonne préparation de données et gouvernance, les DSI sont également confrontés à un risque croissant de confusion, alors que plusieurs fournisseurs de technologies adoptent des approches, similaires à Genie Ontology, visant à ancrer l’IA d’entreprise dans un contexte métier, selon les analystes. Au cours de l’année écoulée, Snowflake, Microsoft et d’autres ont lancé des offres sous forme de solutions sémantiques et de couches contextuelles, mais le problème réside dans la manière dont ces offres sont nommées. « Chacun a donné un nom différent à une idée fondamentalement identique. Cela ralentit les utilisateurs car cela crée de la confusion », prévient Michael Leone. Cette perturbation pourrait également se retourner contre Databricks et d’autres fournisseurs, selon Bhupendra Chopra, cofondateur et directeur commercial du cabinet de conseil IT Kanerika : « Alors que le marketing s’est orienté vers des offres axées sur la construction de contexte, la plupart des entreprises choisiront la plateforme sur laquelle leurs données résident déjà. »

Le control plane de l'IA, mère de toutes les batailles

Ashish Chaturvedi a réaffirmé ce point de vue, affirmant que les DSI devaient éviter d’évaluer les offres de contextualisation de manière isolée et leur a demandé de s’en tenir au principe selon lequel cette couche suit la gravité des données : « Si vos données résident dans Databricks, Genie Ontology est la solution qu’il vous faut. Si elles se trouvent dans Snowflake, c’est Horizon Context. Si vous utilisez Microsoft, c’est la gamme IQ ». De son côté Ashish Chaturvedi exhorte les DSI à ne pas se limiter aux fonctionnalités et à évaluer le degré d’ouverture et de portabilité de ces offres, en particulier dans les environnements multiplateformes où les définitions métier peuvent devoir être transférées entre différents data lakehouse, outils d’analyse et plateformes IA. C’est là qu’il voit Snowflake se démarquer de ses concurrents, grâce à l’accent mis sur l’interopérabilité sémantique ouverte visant à réduire le risque de verrouillage sémantique à mesure que les entreprises font évoluer leurs piles de données et d’analyse.

Des analystes ont toutefois souligné que les efforts de Snowflake pour se démarquer attirent l’attention, du moins pour les DSI, sur la bataille que se livre les fournisseurs, dont Databricks, pour assurer le contrôle sur l’IA dans les entreprises. Alors que Snowflake tente de se positionner avec Horizon Context et son initiative commune avec Salesforce en faveur d’une interopérabilité sémantique ouverte, Microsoft intègre la logique métier et la gouvernance dans l’ensemble de sa pile d’IA, comprenant Copilot et Fabric, via des offres telles que Work IQ, Fabric IQ et Foundry IQ. L’ontologie Genie de Databricks s’inscrit également dans une stratégie similaire, a souligné Ashish Chaturvedi, qui conseille aux DSI de considérer cette offre au regard de l’effort plus large de l’entreprise visant à positionner sa plateforme lakehouse comme le fondement sur lequel les agents IA sont construits, gouvernés et, à terme, déployés. « Il s’agit clairement d’une stratégie axée sur le plan de contrôle. Lorsque l’on relie entre elles toutes les annonces faites par Databricks lors de ce sommet, notamment LTAP, OpenSharing et Genie Ontology, on constate qu’il existe un lieu unique où convergent les données d’entreprise, la gouvernance, la sémantique métier et l’exécution des agents », analyse Ashish Chaturvedi.

Ce dernier souligne d’ailleurs que la stratégie relative au control plane de l’IA reflète la vision plus large d’Ali Ghodsi, selon laquelle les plateformes de données pourraient évoluer vers ce que le CEO de Databricks décrit comme un système de référence faisant source d’autorité à partir de laquelle les agents IA lisent, raisonnent et agissent. Ce concept fait écho à des évolutions antérieures des plateformes, a expliqué Ashish Chaturvedi, lorsque les systèmes ERP sont devenus le système de référence pour les transactions commerciales et que les entrepôts de données sont devenus le système de référence pour l’analyse. Selon l’analyste, la prochaine bataille portera sur la plateforme qui deviendra le système de référence pour les agents d’IA d’entreprise. Michael Leone, de Moor Insights and Strategy, a convenu que les plateformes de données sont bien placées pour prétendre à ce rôle, car elles disposent déjà des données, des contrôles de gouvernance, de la traçabilité et des autorisations dont les agents ont besoin pour fonctionner en toute sécurité à grande échelle. Les analystes ont toutefois averti que le contexte à lui seul ne déterminera pas quel fournisseur s’imposera. « Le prochain champ de bataille de l’IA d’entreprise ne se résume pas au contexte. Il s’agit de l’exécution vérifiable », a déclaré Stephanie Walter.