Créé en 2012, le e-commerçant spécialiste du bricolage et du jardinage ManoMano est une pure place de marché, fédérant plus de 5000 marchands. La nature même de ce positionnement place la donnée au coeur de l'activité. « Elle fait partie de notre ADN », indique Cédric Cormont, le responsable de l'architecture et de la data d'une société qui est passée de quelques dizaines de personnes à environ 1000 salariés en quelques années. L'activité de distribution de ManoMano rend aussi la société très attentive aux coûts. Deux ingrédients qu'on retrouve dans la migration du datawarehouse vers la technologie Snowflake que la société a menée à bien. « Notre ancien entrepôt de données posait des problèmes de performances, raconte Cédric Cormont, présent lors du salon Big Data & IA qui se tenait à Paris fin septembre. Snowflake nous a permis de passer à l'échelle. Mais cette migration a aussi ouvert d'autres chantiers, car la technologie a décuplé l'appétit de data des utilisateurs, nous poussant à mieux maîtriser les coûts et à renforcer la gouvernance. »

Passée la migration technique vers la technologie cloud de Snowflake - qui encaisse aujourd'hui environ 55 000 requêtes journalières -, ManoMano a donc constitué une équipe pour gérer sa plateforme data. « Notre première priorité a consisté à monitorer les coûts, avec un modèle d'affichage de ceux-ci pour les entités métiers (showback) », indique le responsable. En parallèle, ManoMano structure son organisation data autour de deux populations clefs, les « Data Builders » d'un côté, autrement dit les équipes en charge de la plateforme gérant la donnée, et les « Data Storytellers » de l'autre. « La collecte de données reste ainsi à la main de l'équipe en charge de la plateforme. Nous passons des contrats sur la donnée avec les data owners pour qu'ils nous donnent accès aux données nécessaires de façon contrôlée, via une méthodologie qu'ils choisissent, soit la data capture, soit la publication d'événements. » Sur cette base, les équipes de développement bâtissent des produits basés sur la donnée, ensuite mis à disposition des « Data Storybuilders », en charge du partage d'information, de l'exploration et du reporting et, éventuellement, des développements en machine learning (notamment sur SageMaker d'AWS).

Réduire la dette technique, créer une plateforme data

« Notre organisation data est partout au sein de l'entreprise, elle n'est pas confinée à un département, insiste Cédric Cormont. On retrouve des équipes de développement de projets data à l'ingénierie, des Data Scientists ou des analystes au sein des départements en charge des produits, etc. Ces différentes équipes s'alignent entre elles via un fonctionnement en communauté ». Sans oublier un outillage dédié à la gouvernance, via le catalogue CastorDoc. Y figurent les data owners, la lignée des données (autrement dit les sources et transformations), les définitions des termes métiers et des KPI, ainsi que les méthodes de calcul.

De gauche à droite, Cédric Cormont, responsable de l'architecture et de la data de ManoMano, Armelle Patault, responsable Data Science ManoMano, et Claire Trithardt, directrice de comptes chez Snowflake.

« Nous voulons être performants sur le time-to-market sans alourdir notre dette technique », résume le responsable de l'architecture data. Un équilibre qui a nécessité un certain nombre d'évolutions. En 2020, la data Factory compte ainsi 10 personnes et apparaît comme un vrai goulet d'étranglement dans l'accès aux données des métiers. Si bien que ceux-ci ont tendance à la contourner pour créer leurs propres produits data, générant de la dette technique.

Ce constat pousse la marketplace à évoluer vers une organisation fédérée et distribuée. « Sauf que, début 2021, nous n'étions pas prêts à effectuer cette transition », observe Cédric Cormont. ManoMano crée alors un train data - soit plusieurs équipes de développement travaillant de façon synchronisée en mode agile - afin de réduire sa dette technique et créer une plateforme data bien structurée. 40 développeurs sont mobilisés sur cet effort. « Fn 2022, nous étions prêts à travailler dans un mode totalement distribué ». Le train s'allège et l'effectif de développeurs qu'il embarque redescend alors à environ 20 personnes. « Car nous avions pu réduire la dette technique et mettre en place le self-service auprès des métiers », justifie le responsable de l'architecture et de la data.