« Sur la data, on a tout essayé ». Lors d'une conférence organisée par l'éditeur Snowflake, Simoh-Mohammed Labdoui, responsable de la data groupe chez Saint-Gobain, ne cache pas les tâtonnements de la stratégie du groupe industriel aux 160 000 collaborateurs. Avec, au départ, une volonté de centralisation. « Nous sommes sortis de cette approche, raconte le responsable, tout en gardant la capacité de réutilisation d'un produit de données à l'autre. » Une façon de se rapprocher des métiers et de les responsabiliser sur le sujet, en ligne avec la culture d'un groupe où prime la décentralisation. Sur le plan technique, pour Simoh-Mohammed Labdoui, le système centralisé soulevait également la problématique de la duplication de la donnée : « en décentralisant, vous pouvez ne conserver en central que la matière première, soit les objets métiers sourcés pour les cas d'usage, et donner l'autonomie aux départements sur l'exploitation de cette matière. »

Se focaliser sur la qualité de la donnée

L'architecture décrite par Simoh-Mohammed Labdoui, qui dirige un service de 200 personnes vouées à la data, combine un datalake central et des datawarehouses orientés sur les besoins des différentes entités, sur lesquels les métiers ont l'autonomie. La démarche, elle, a consisté tout d'abord à ingérer de multiples sources de données internes - dont celles issues de plus de 200 ERP ! - et externes, puis à superviser la qualité technique de ces sources (comme les formats, la complétude, la fraîcheur, etc.). « Nous avons alors commencé à transformer la data pour créer des objets métiers, qui servent de socle pour créer les cas d'usage », explique le responsable data. « En la matière, Snowflake s'est révélé être un vecteur de simplification. Nous ne voulions pas consacrer nos ressources à administrer des environnements techniques, mais plutôt nous focaliser sur la qualité de la donnée - car penser qu'on va récupérer d'emblée une donnée de qualité relève du fantasme - et sur la performance économique des produits déployés. » La plateforme de données ainsi créée est à l'origine de plus de 70 projets dans le groupe et voit passer 6 millions de transactions par jour.

Simoh-Mohammed Labdoui, responsable de la data groupe chez Saint-Gobain : « Notre objectif est d'accélérer l'adoption de notre data marketplace ». (crédit : R.F.)

Sur ce socle, Saint-Gobain a greffé une place de marché de la data, visant à rendre la donnée accessible à tous et doper les usages. « Ce qui a replacé les questions de gouvernance - la catalogage des objets, la gestion des accès, la classification de la donnée... - au coeur des relations avec les responsables métiers », souligne celui qui a rejoint Saint-Gobain il y a un an, en provenance de la SNCF.

Les accès à la main des Data Owners

Cette marketplace, qui exploite les fonctions de virtualisation de la donnée de Snowflake et sa gestion des accès, compte 30 000 utilisateurs. Via le catalogue ou les fonctions de recherche, ils accèdent à des rapports prêts à l'emploi et, surtout, à des jeux de données (proposés sous forme d'API, d'implémentation dans un datawarehouse ou de fichiers à exporter). « La gestion de la confidentialité des données est assurée par les propriétaires de jeux de données eux-mêmes, via un workflow de gestion des demandes d'accès. Au besoin, des filtres peuvent être activés pour masquer une partie des données », souligne le responsable de la data groupe chez Saint-Gobain.

Et ce dernier d'imaginer déjà la v2 de cette marketplace, une évolution qui devrait intégrer un chatbot permettant aux utilisateurs de poser leurs questions en langage naturel. « Notre objectif est d'accélérer l'adoption de cette marketplace de la donnée et de renforcer la collaboration entre producteurs et consommateurs de données », dit Simoh-Mohammed Labdoui.