Un défi de plus en plus évident attend les entreprises qui passent de l'expérimentation des agents IA aux déploiements en production  : la fiabilité des systèmes IA dépend entièrement du contexte métier dans lequel ils opèrent. C’est le problème que tente de résoudre Snowflake avec Horizon Context, un ensemble de fonctionnalités de gestion sémantique et de métadonnées, actuellement en test, dévoilé mardi lors de la conférence annuelle Snowflake Summit ( du 1ᵉʳ au 4 juin à San Francisco). Selon Artin Avanes, responsable de la plateforme de données centrale chez Snowflake, cette offre, lancée dans le cadre de la suite actuelle de découverte, de gestion et de gouvernance des données Horizon Catalog.

Elle collecte des métadonnées provenant de l’ensemble du patrimoine de données d’une entreprise, les enrichit avec des définitions métier, des relations, la traçabilité et des informations de gouvernance, et met ce contexte à la disposition des systèmes IA et analytique. Comme l’a expliqué Artin Alves, ces fonctionnalités s’appuient sur l’acquisition par le fournisseur, l’an dernier, de Select Star, une start-up spécialisée dans la gestion des métadonnées, connue pour ses intégrations avec des systèmes de bases de données tels que PostgreSQL et MySQL, des outils comme Tableau et Power BI, ainsi que des éléments de pipeline et d’orchestration de données tels que dbt et Airflow.

Réduire la complexité opérationnelle des agents

« En fournissant une cartographie régulée du patrimoine de données de l’entreprise aux DSI, Horizon Context devrait réduire la complexité opérationnelle », a estimé Stephanie Walter, responsable de l’activité IA chez HyperFrame Research. « L'intérêt ne réside pas simplement dans le catalogage de l'emplacement des données, mais dans la capacité à fournir aux systèmes IA les métadonnées, la traçabilité, les autorisations et le contexte métier nécessaires pour extraire les bonnes données en toute sécurité », a ajouté l’analyste. En réalité, selon Robert Kramer, associé gérant chez KramerERP, le défi posé par le manque de contexte pour l’analyse et le reporting n’est pas nouveau pour les entreprises. « La plupart des entreprises assemblaient des catalogues, des couches sémantiques de BI, des outils de gouvernance, des informations de traçabilité, des contrôles d’accès, des modèles dbt, des politiques de sécurité et des intégrations personnalisées. Le problème n’était pas que ces éléments n’existaient pas, mais qu’ils étaient fragmentés », a-t-il déclaré.

Pour Mike Leone, analyste principal chez Moor Insights & Strategy, ce rafistolage de différents éléments est la véritable raison pour laquelle la plupart des équipes d’une entreprise se retrouvaient avec des versions légèrement différentes d’un indicateur métier, notamment le nombre d’utilisateurs actifs mensuels, ce qui entraînait également une incohérence des agents IA en aval. Mais, selon Mme Walter, l'assemblage de différents catalogues et couches sémantiques ne fonctionne que pour les workflows semi-autonomes. « Ce qui a changé avec les agents IA, c'est que ces systèmes ont de plus en plus besoin d'accéder au contexte au moment de l'exécution plutôt que par le biais de la documentation et de l'interprétation humaine », a-t-elle souligné. « Snowflake tente de rapprocher ces éléments de la plateforme de données, afin que le contexte, la sémantique, le contrôle d'accès et l'exécution fassent partie du même environnement d'exploitation. »

Un contexte métier persistant

Pour compléter Horizon Context, Snowflake a également introduit Semantic Studio, actuellement en aperçu privé, afin d’aider les entreprises à créer et à maintenir plus facilement le contexte métier pour les agents et les workflows agentiques. « Semantic Studio est un élément central de la couche Enrich d’Horizon Context, fournissant l’espace de travail assisté par l’IA où les équipes définissent, testent et publient cette logique métier », a indiqué M. Avanes. « La couche Enrich elle-même, qui comprend des fonctionnalités complémentaires comme Semantic View Autopilot, superpose automatiquement de l’intelligence aux actifs de données, fournissant des informations sur les actifs les plus fiables, leurs interconnexions, leur signification et la manière de calculer correctement les métriques », a précisé l’analyste.

Selon M. Leone, Semantic Studio résout un défi majeur : « Il allège la charge de travail des ingénieurs de données maîtrisant le langage SQL et permet aux responsables métier de rédiger les définitions partagées. C’est là que la plupart des projets de couche sémantique échouent aujourd’hui. » Mme Walter émet toutefois une réserve sur ces offres. « Si elles réduisent la complexité, elles ne suppriment pas le travail. Quelqu’un doit toujours décider quelles métriques font autorité, quels produits de données sont fiables et qui détient les définitions métier », a-t-elle fait remarquer.

Répondre aux préoccupations de sécurité et de gouvernance

Parallèlement à ces mises à jour, Snowflake s’efforce également de répondre aux préoccupations de sécurité liées aux flux de travail automatisés grâce à de nouvelles fonctionnalités intégrées au Trust Center de Horizon Catalog. Ces fonctionnalités, axées sur la gestion de la posture de sécurité de l’IA (Security Posture Management, SPM), comprennent une fonctionnalité d’identité des agents qui permet aux entreprises de faire la distinction entre l’activité humaine au sein d’une session et les actions effectuées par un agent IA agissant pour le compte d’un utilisateur », a expliqué Artin Avanes. « Cela devrait offrir une plus grande transparence et une meilleure auditabilité pour les agents, et la possibilité pour les entreprises d’appliquer les contrôles d’accès aux données existants, par exemple le masquage dynamique et les politiques d’accès aux lignes, agent par agent », a-t-il fait valoir. Une autre fonctionnalité régissant les politiques d’exfiltration des données, actuellement en preview privé, aidera les entreprises à empêcher le transfert non autorisé de données sensibles. « Ces politiques s’inscrivent dans le cadre de gouvernance plus large d’Horizon Catalog et permettront aux entreprises de définir des contrôles sur la manière dont les données peuvent être consultées, partagées et transférées entre les systèmes », a avancé M. Avanes.

Mme Walter note encore que ces fonctionnalités pourraient aider les entreprises à surmonter l’un des principaux obstacles au déploiement d’agents IA en production : la gouvernance. « Les contrôles de l'exfiltration des données, la gestion de la posture de sécurité de l'IA et d'autres contrôles centralisés de l'IA aident les DSI à passer de la phase d'expérimentation à la mise en production en offrant aux équipes de sécurité un moyen de visualiser et de réguler la manière dont les charges de travail liées à l'IA interagissent avec les données de l'entreprise », a-t-elle déclaré. Faisant écho à Mme Walter, M. Leone est d’accord pour dire que la « question de la sécurité » est le principal obstacle à presque tous les déploiements d’agents que Moor Insights & Strategy suit actuellement. « Ce sont des fonctionnalités comme les politiques de protection contre l’exfiltration des données et la gestion de la posture de sécurité de l’IA qui font qu’un RSSI valide ou pas le déploiement d’agents en production », a-t-il ajouté.