Databricks, fournisseur d'une plateforme en gestion des big data basée sur le moteur Apache Spark, étoffe son offre. L'éditeur a en effet annoncé une version de son lakehouse dédiée pour le secteur de l'industrie et de la fabrication. Avec ce lancement, Databricks espère prendre de court ses concurrents dans ce domaine. Contrairement aux data lake et aux data warehouse qui stockent les données respectivement en format natif et structuré (souvent SQL), l’architecture de données des lakehouse - popularisé par Databricks lui-même - amène des capacités supplémetaires. Baptisé Databricks Lakehouse for manufacturing, ce service apporte ainsi des capacités de maintenance prédictive, de jumeaux numériques, d'optimisation de la chaîne d'approvisionnement, de prévision de la demande, d'analyse IoT en temps réel, de vision par ordinateur et d'IA, ainsi que des outils de gouvernance et de partage des données.

Lakehouse for manufacturing comprend l'accès à des accélérateurs de cas d’usage packagés capables de lancer un processus analytique et d’apporter un schéma directeur pour aider les entreprises à relever des défis industriels critiques et à forte valeur ajoutée, a déclaré Databricks dans un communiqué. Pour faciliter l’usage de ce lakehouse dédié au secteur manufacturier, l'éditeur fournit des services et des outils soutenus par des partenaires, rassemblés sous la dénomination Brickbuilder Solutions. Par exemple, des services de migration des bases de données, de gestion et d'intelligence des data, de gestion de la croissance des revenus, ou encore des services financiers et de migration des données dans le cloud. Parmi les partenaires de l'éditeur pour cette offre on trouve  Accenture, Avanade, L&T Mindtree, Wipro, Infosys, Capgemini, Deloitte, Tredence, Lovelytics et Cognizant. Lakehouse for Manufacturing de Databricks a été adopté par des entreprises comme DuPont, Honeywell, Rolls-Royce, Shell et Tata Steel.

Aider les gestionnaires de données

Selon Carl Olofson, vice-président de la recherche chez IDC, le Lakehouse for Manufacturing de Databricks devrait avoir un impact positif sur les gestionnaires de données ou les ingénieurs de données. « Avec l'offre Lakehouse, les gestionnaires de données pourront coordonner facilement les données entre les environnements de data lake et d'entrepôt de données, garantissant ainsi la cohérence, l'actualité et la fiabilité des données », a déclaré M. Olofson. D'autres analystes estiment que cette offre aidera également les équipes de data scientists dans les entreprises. « Ils pourront disposer directement d’analyses préconfigurées plutôt que de partir de zéro », a déclaré Tony Baer, analyste principal chez dbInsights. Selon Doug Henschen, analyste principal chez Constellation Research, par rapport à d'autres offres concurrentes, Databricks est mieux placé pour fournir des capacités avancées en matière de science des données. « C’est très évident avec Databricks Lakehouse for Manufacturing, qui inclut la prise en charge des jumeaux numériques, de la maintenance prédictive, des prévisions de la demande et de la vision par ordinateur », a déclaré M. Henschen.

Accélérer l'adoption du data lake

Selon M. Olofson, l'offre Lakehouse for Manufacturing de Databricks vise à accélérer l'adoption des offres Lakehouse de l'entreprise et à accroître l'adhésion à d'autres services. « Lakehouse est encore un concept nouveau et quelque peu informe. Databricks voudrait accélérer l'adoption en proposant des services d'hébergement spécifiques à l'industrie. On peut comparer cela à des « kits de démarrage », car les éléments essentiels de tout Lakehouse sont spécifiques aux données dont dispose l'entreprise et à la manière dont elles doivent être rassemblées », a encore déclaré M. Olofson. Toujours selon M. Olofson, la fourniture de ces kits, ou de ce qu'IBM appelait autrefois des « modèles », a pour but de stimuler l’usage des bases de données en offrant aux entreprises un ensemble de fonctionnalités partielles que les utilisateurs peuvent compléter avec des définitions et des règles propres à l'entreprise. « C’est une approche bien connue dans le domaine des logiciels, quand on cherche à vendre des produits complexes ou multifonctionnels, car les clients ne savent souvent pas comment commencer. Si Databricks parvient à séduire les clients avec ces offres d'entrepôts, ils pourraient bénéficier en retour d’un certain niveau de fidélité », a ajouté M. Olofson.

Selon M. Henschen de Constellation Research, pour le lancement d'entrepôts spécifiques à un secteur, Databricks a tenu compte de diverses priorités internes, en examinant par exemple les secteurs pouvant représenter le plus grand potentiel pour ses offres, et en s’intéressant à la demande spécifique à un secteur. « Databricks a lancé un Lakehouse pour le secteur manufacturier après avoir introduit des offres similaires pour le commerce de détail, les services financiers, la santé et les sciences de la vie, ainsi que les médias et le divertissement l'année dernière », a expliqué M. Henschen. « Le lancement de l'offre spécifique à l'industrie a une visée incitative, et l’ajout de fonctionnalités comme des modèles analytiques prédéfinis peut inciter les entreprises à adhérer à l'approche Lakehouse et à se lancer dans l’aventure », a déclaré M. Baer de dbInsights.

Databricks Vs Snowflake

Selon les experts, Databricks, qui est en concurrence avec Snowflake, Starburst, Dremio, Google Cloud, AWS, Oracle et HPE, a fait en sorte que ses annonces sur les datacenters spécifiques à l'industrie lui procurent un avantage compétitif sur Snowflake. « Les annonces sont très similaires à celles de Snowflake et il y a une volonté de compétition dans le calendrier des annonces », a déclaré M. Henschen. Selon lui, Snowflake pourrait avoir une longueur d'avance puisque ses annonces de cloud industriel datent de 2021 avec des offres cloud pour les médias et les services financiers. Cependant, il note une différence d'approche sur le plan de la communication entre les offres de produits de Snowflake et de Databricks. Snowflake n'utilise pas le terme « lakehouse » dans ses documents, même s’il dit supporter les charges de travail des lacs de données. « Sa technologie repose sur un système de gestion de base de données relationnelle (Relational Database Management System, RDBMS) basé sur le cloud, avec des extensions qui prennent en charge les données semi-structurées et non structurées, ainsi que les données dans des formats de stockage courants comme Apache Iceberg », a déclaré M. Olofson, ajoutant que Snowflake proposae également des configurations spécifiques à l'industrie.

Quoiqu’il en soit, les analystes pensent qu'il est trop tôt pour évaluer tout changement dans l’évolution du marché de ces offres spécifiques à l'industrie. « Il est encore tôt pour que ces entreprises combinées de type « lakehouse » supplantent les entreprises en place. Les clients de Databricks exécutent peut-être plus de charges de travail analytiques SQL sur Databricks que par le passé, mais je ne pense pas qu'il supplante les opérateurs historiques dans la prise en charge des charges de travail critiques à grande échelle », a déclaré M. Henschen. « De même, Snowflake Snowpark n'en est qu'à ses débuts et je ne pense pas que les clients choisissent Snowflake comme plateforme pour répondre à leurs besoins en matière de science des données. Pour chaque besoin, c'est le meilleur qui l'emporte », a ajouté M. Henschen.