Revendiquant la deuxième place mondiale sur le marché des vins et spiritueux, le groupe français Pernod Ricard compte près de 19 000 employés dans le monde et réalise 92 % de son chiffre d'affaires, environ 8,5 milliards d'euros, hors de France. Il est organisé en « sociétés de marques » (six entreprises produisant les vins ou spiritueux) et « sociétés de marchés » (86 sociétés distribuant les produits, chacune sur un territoire). « Il y a deux ans, nous avons amorcé un programme pour devenir data centric » a remémoré Anaïs Ghelfi, data platform manager chez Pernod Ricard lors de son témoignage à l'invitation de Snowflake.

Plusieurs projets ont alors vu le jour avec des objectifs précis. Ainsi, par exemple, Matrix visait à optimiser les investissements marketing en utilisant des données d'origines autant internes qu'externes. Pour délivrer la bonne promotion au bon client au bon moment, Pernod Ricard a mis en oeuvre Vista Rev'Up. Et D-Star avait pour objet de proposer le bon produit au bon client au bon moment. Pour mener à bien ce programme et ces différents projets, Pernod Ricard a bien sûr embauché des data scientists. Le groupe a aussi constitué un centre d'excellence data (Data CoE, center of excellence) adossé à la DSI afin d'apporter le soutien technique nécessaire à chaque cas d'usage identifié. Ce Data CoE a trois piliers, les trois « P » : People (les talents), Platform (la plate-forme technique) et Process (les processus).

Une plateforme unique pour toutes les données

La plate-forme technique globale de traitement des données (Global Data Platform, GDP) vise à traiter des données internes connectées en temps réel par API, des données externes (météo, nombre de contaminations par le Covid...) et des données importées sous forme de fichiers plats. Cette GDP repose techniquement sur la solution Snowflake hébergée dans le cloud Azure. En tout, Snowflake gère 9 To de données alimentant une cinquantaine de projets mis en oeuvre par 200 utilisateurs actifs. Enfin, une boîte à outils commune a été constituée, essentiellement composée de modules Python. Côté métiers, les 7000 utilisateurs finaux disposent d'un portail d'exploitation des données à base de Microsoft PowerBI sur Azure.

« Garantir la qualité des données est très important pour rassurer les utilisateurs mais il faut aussi la rendre disponible et accessible » a insisté Anaïs Ghelfi. Cette disponibilité ne doit pas remettre en cause la sécurité : on parle de données commerciales sensibles. Pour bien gérer la sécurité et les droits d'accès, Pernod Ricard a, assez classiquement, défini des rôles avec des droits précis, chaque utilisateur étant rattaché à tel ou tel rôle.

Une bascule progressive d'AWS vers Azure

Au départ, il y a quatre ans, toutes les données étaient rassemblées sur une instance Snowflake sur l'hébergement AWS. Cette « base de données de synthèse » étant ensuite répliquée toutes les vingt-quatre heures sur Microsoft Azure dans différentes bases de données pour les usages de chaque filiale utilisatrice sous la responsabilité de celle-ci. Le choix de Microsoft Azure se justifie par la volonté de capitaliser sur les outils groupe (comme PowerBI) maîtrisés par les collaborateurs.

Progressivement, Pernod Ricard abandonne l'instance sous AWS au profit d'une bascule complète sur Azure afin de réduire les coûts inutiles. Plusieurs autres évolutions sont d'ores et déjà prévues. Par exemple, les utilisateurs vont bénéficier d'un catalogue des données disponibles sur leur portail. Et le continent asiatique va bénéficier de sa propre instance.