ManoMano est une place de marché spécialisée en bricolage et produits connexes distribuant 16 millions de références produits provenant de 4000 marchands partenaires auprès de 50 millions de visiteurs mensuels et 7 millions de clients actifs par mois. « La data est core-business chez ManoMano » a insisté Cédric Cormont, senior data architect chez ManoMano lors d'une présentation réalisée à l'invitation de Snowflake. En effet, qu'il s'agisse de traiter les données sur les produits distribués, de bien comprendre le comportement des utilisateurs ou de calculer les indicateurs-clés de performance, la donnée est au coeur du travail quotidien de la place de marché. Avec la croissance de l'entreprise, celle-ci rencontrait des problèmes de performance qu'il fallait corriger. Et, à l'occasion de ce chantier, un travail plus en profondeur a permis de mieux valoriser le patrimoine de données stockés.

Cédric Cormont a détaillé ses besoins en présentant quelques exemples de cas d'usage de la donnée. Ainsi, pour vérifier la pertinence des niveaux tarifaires et la qualité de l'offre proposée, ManoMano réalise beaucoup de web-scrapping. Bien entendu, le comportement client est aussi suivi grâce aux traçage de ses actes sur le site. Data science et machine learning sont aussi employés pour améliorer la recherche de produits par le client, les recommandations et mes ventes additionnelles. Pour contrôler la performance générale, 200 indicateurs-clés sont calculés dont une trentaine de principaux. Enfin, comme la place de marché dispose d'un réseau de 4000 marchands partenaires, la catégorisation et l'intégration des attributs des produits à partir des fiches descriptives sont largement automatisées grâce à l'analyse de données.

Un sujet d'abord de performance et d'organisation

Comme les requêtes de consultations des données se chiffrent en millions chaque mois, la performance est devenue une question critique. L'architecture basée sur Amazon Redshift sur AWS ne satisfaisait plus ManoMano. Si la performance était le déclencheur d'une recherche de solution technique, d'autres sujets connexes induits devaient ensuite être traités pour mieux valoriser le patrimoine de données, en particulier l'amélioration de la qualité des données et la réduction de la dette technique accumulée au fil de projets successifs. Cédric Cormont stipule : « il y a deux ans, nous avons migré vers Snowflake pour régler notre problème de performance. Le projet a duré six mois et n'a pas résolu les problèmes supplémentaires, notamment la qualité des données, car nous avons réalisé un transfert direct table à table. » Pour des questions pratiques, l'hébergement S3 d'AWS a été conservé.


Cédric Cormont, senior data architect chez ManoMano, a présenté l'architecture technique adoptée 

La question abordée ensuite a été l'optimisation des processus associés au traitement de la donnée et de l'organisation induite concernant une soixantaine de spécialistes de la donnée. ManoMano disposait d'une data factory centralisée où les experts données étaient sollicités en mode ticket, répondant à chaque demande l'une après l'autre. ManoMano l'a réorganisée en créant une équipe de gestion technique (production : la « coreteam dataplatform ») et des équipes thématiques, les « data squads » (B2B, B2C, buyers, sellers, catalog, etc.), chacune étant focalisée sur un métier avec tous les profils nécessaires pour une gestion globale des questions. « La qualité des données a été améliorée par la décentralisation et la responsabilisation des équipes mixtes IT/métier » a précisé Cédric Cormont.

Optimiser la valeur produite

Cette nouvelle organisation a permis à l'équipe technique de se focaliser sur la problématique technique. En particulier, il fallait optimiser les coûts dans une architecture reposant uniquement sur le cloud public. ManoMano a logiquement adopté l'approche FinOps en se basant sur les outils de Snowflake pour réaliser un bilan des usages. La place de marché en a aussi profité pour améliorer son traitement des incidents et s'assurer que chaque outil développé et mis en place était bien conçu pour répondre aux besoins et attentes des utilisateurs. Pour éviter de démultiplier le stockage et les copies de données, la fonctionnalité de data sharing [partage de la donnée, NDLR] proposée par Snowflake a été appréciée car elle permet à chaque utilisateur de disposer des données utiles avec les droits nécessaires sans avoir à multiplier les copies volumineuses.

Enfin, la dernière étape du programme a consisté en une refonte de l'organisation de la donnée dans Snowflake. En effet, initialement, rappelons-le, les données avaient été transférées table à table. Le schéma des données a donc été optimisé et, surtout, chaque table a été documentée. Cédric Cormont a insisté : « nous avons veillé à tout documenté mais aussi à rendre chaque vue créée réutilisable autant que possible ainsi qu'à lier les usages de données aux attentes business ». Pour responsabiliser les métiers vis-à-vis de leurs demandes, ManoMano a appliqué une recette claire : chaque coût est imputé sur le budget du métier demandeur.