SAP poursuit ses emplettes pour renforcer sa stratégie data à destination de l’IA agentique. En mars dernier, la firme allemande avait mis la main sur Reltio, spécialiste du MDM (master data management) pour s’ouvrir au monde non SAP. Aujourd’hui, elle annonce le rachat pour un montant non communiqué de Dremio, société américaine fondée en 2015.
Cap sur Apache Iceberg avec Dremio
La société fournit une plateforme de datalake conçue pour accélérer les charges de travail analytique et IA. Mais l’intérêt de SAP pour Dremio réside dans le fait que le fournisseur s’appuie sur les projets open source Apache Icerberg (tables), Polaris (catalogue de données) et Arrow (traitement des données en colonnes). En avril dernier, il a intégré le support d’Iceberg V3 offrant une meilleure gestion du format JSON, la capture des données modifiées et l’évolution des schémas.
Grâce à cette acquisition, Business Data Cloud de SAP devient nativement compatible avec Iceberg. Les données SAP et non-SAP peuvent désormais coexister sur une même plateforme ouverte, sans migration ni conversion de format. Dremio est une plateforme serverless qui s'adapte automatiquement aux pics et aux baisses de charge. Avec cette opération, l’éditeur allemand développera également un catalogue universel et ouvert basé sur Polaris. Il servira de base au Knowledge Graph, intégrant les relations métier, les structures organisationnelles, les classifications réglementaires et la traçabilité inter-systèmes comme propriétés natives. L’objectif étant d’apporter du contexte aux agents IA.
Une avancée pour l’IA
Pour les analystes, le rachat de Dremio montre que SAP entend réduire sa dépendance au partenariat avec Databricks et Snowflake. Harikishore Sreenivasalu, spécialiste en stratégie SAP et CEO d'Aarini Consulting aux Pays-Bas, a déclaré que les deux fournisseurs de data store auraient été des cibles d'acquisition idéales il y a quelques années, mais qu'ils seraient aujourd'hui beaucoup trop chers. Pour lui, Dremio « est un nouvel acteur sur le marché et doit encore gagner en maturité pour répondre aux besoins des entreprises. Ses aspects liés à la sécurité doivent être renforcés ». Il ajoute que ce rachat « est la pièce manquante. SAP possède Joule, Business Technology Platform. SAP a les processus métier. Désormais, il dispose de l'infrastructure de données ouverte nécessaire pour fournir aux agents IA le contexte dont ils ont besoin pour agir, et non plus seulement pour répondre ».
Pour les responsables de SAP, les acquisitions vont aider à supprimer certaines limitations des LLM. Philipp Herzig, directeur technique de l’éditeur indique que les modèles « gèrent mal les données chiffrées » et qu’ils éprouvent des difficultés avec les données structurées « un domaine où la différenciation est importante ». Concrètement, la différence réside dans la capacité des systèmes à prédire l'avenir plutôt qu'à analyser le passé, par exemple pour estimer les ventes d'un produit d'un détaillant au cours des 10 prochains mois, ou pour prévoir les retards de paiement et leur impact sur la trésorerie prévisionnelle. Le dirigeant insiste aussi sur le fait que la capacité de Dremio à exploiter les données d'entreprise hébergées sur les systèmes locaux des entreprises est essentielle pour celles qui sont fortement réglementées.
Un traitement en local comme atout
Flavio Villanustre, RSSI du groupe LexisNexis Risk Solutions, considère également la possibilité de gérer les données localement comme un atout majeur. A la différence de Snowflake ou Databricks, « Dremio offre un accès décentralisé et facile aux données, permettant aux utilisateurs d'y accéder directement » note-t-il. Les deux concurrents apportent tous deux des fonctionnalités performantes, a-t-il souligné, mais les utilisateurs doivent transférer les données vers leur plateforme et les reformater. Une fois cette opération terminée, on obtient un lac de données centralisé pour répondre aux besoins d'accès aux données. « Dremio en revanche propose un accès décentralisé et facile aux données » a-t-il déclaré. Il ajoute, « Bien sûr, cela peut se faire au détriment des performances de traitement des données, mais la facilité d'utilisation et la flexibilité peuvent compenser cette perte ». L’analyste relève que « la rapidité de mise en œuvre, en quelques jours au lieu de plusieurs semaines ou mois, est un autre avantage »
Sanchit Vir Gogia, analyste principal chez Greyhound Research, partage l'avis de Flavio Villanustre, mais dans une certaine mesure. « La distinction n'est pas aussi tranchée que Dremio laisse les données en place, tandis que Snowflake et Databricks exigent une migration complète », a-t-il souligné. Les deux sociétés « ont tous deux investi massivement dans l'accès aux données externes, leur partage, les formats ouverts, les couches de gouvernance et l'interopérabilité. Il serait donc injuste de les qualifier de plateformes à l'ancienne, du type tout migrer d'abord. » Mais, l’analyste souligne que l'argument général est pertinent. « Dremio part du principe que les données d'entreprise sont déjà distribuées et que le premier problème réside souvent dans l'accès, le contexte, la fédération et la gouvernance, et non dans une relocalisation intégrale. Pour les clients SAP, c'est un point crucial », a-t-il déclaré. Cela s'explique par la nature des ensembles de données de nombreux clients SAP. « La plupart des grands environnements de l’éditeur ne sont pas des environnements de données propres et centralisés », a-t-il précisé. « Ce sont des environnements hétérogènes : données SAP, non-SAP, entrepôts de données hérités, data lake départementaux, référentiels régionaux, systèmes acquis, données partenaires et plateformes sectorielles. » Bien que présenter à ces clients l'idée que la préparation à l'IA commence par la centralisation des données sur une plateforme unique puisse être avantageux pour le fournisseur, cela représente un travail considérable pour l'acheteur.
Vigilance sur les contrats de Snowflake et Databricks dans SAP
Aman Mahapatra, directeur de la stratégie chez Tribeca Softtech, une société de conseil en technologies basée à New York, appelle à la prudence pour les DSI. « Pour les responsables informatiques disposant de contrats Snowflake et Databricks actifs aujourd’hui, rien ne change au cours des deux prochains trimestres. Cependant, d’ici le premier semestre 2027, il faut s’attendre à ce que SAP oriente les nouvelles charges de travail IA vers Business Data Cloud, indépendamment des communiqués de presse relatifs aux partenariats publiés aujourd’hui. Les DSI qui anticipent cette évolution dès maintenant seront en position de force pour négocier », observe-t-il. La véritable valeur ajoutée de l'IA d'entreprise se déplace vers les couches supérieures de l'architecture, notamment la couche sémantique, le catalogue, le graphe de traçabilité et le contexte métier qui permet à un agent de comprendre ce que signifie les process métiers au sein d'une entreprise. « SAP vient d'acquérir les outils nécessaires pour maîtriser cette couche pour toute entreprise utilisant le fournisseur comme système central », a-t-il affirmé. « Si vous utilisez massivement SAP et que vous exécutez des analyses sur Snowflake ou Databricks, vos fournisseurs de datawarehouse vous paraîtront bientôt moins stratégiques et davantage de simples serveurs de calcul haute performance. »
Jason Andersen, analyste principal chez Moor Insights & Strategy, a souligné que SAP encourageait sans relâche les entreprises à héberger toutes leurs données dans ses systèmes depuis un certain temps. La firme ne peut plus revenir sur cette position, même si elle le souhaitait. Selon lui, l'acquisition de Dremio s'attaque aux poches de données que de nombreux DSI d'entreprises, notamment dans le secteur manufacturier et les marchés fortement réglementés, ont refusé de confier à SAP. Cette acquisition offre à l’éditeur une solution honorable pour obtenir un pourcentage encore plus élevé des données de ses clients, a-t-il déclaré. « Le secteur manufacturier est réticent à migrer vers le cloud et ses DSI s'y opposent farouchement », a expliqué l’analyste. « Cette acquisition permet à SAP d'accéder à une grande quantité de données qui n'étaient pas disponibles auparavant. »

Commentaire