Le dépôt-vente en ligne de produits de luxe d'occasion Vestiaire Collective dispose de 9 millions de membres qui vendent et achètent des bijoux, des vêtements, etc. à des prix pouvant atteindre des milliers d'euros. Bien entendu, l'ensemble des données disponible liées à l'activité du site est exploité par différents métiers, à commencer par le marketing. Collecter toutes les données dans un même entrepôt de données était donc une évidence. Dans un premier temps, Vestiaire Collective a utilisé Amazon RedShift, une solution PaaS disponible sur AWS. Or, avec cette solution, il était très coûteux d'injecter toutes les données dans un même datawarehouse : en effet, il fallait accroître la puissance de calcul en même temps que le stockage. Vestiaire Collective a donc cherché une alternative.

Durant l'été 2019, Vestiaire Collective a choisi de réaliser un démonstrateur avec la base de données cloud Snowflake. Ce démonstrateur avait deux objectifs : d'une part, pour la DSI, il fallait vérifier les capacités techniques de l'outil ; d'autre part, il fallait convaincre les métiers de la pertinence du changement au travers de nouveaux cas d'usage (suivi du parcours clients en ligne, efficacité des bannières...) et d'indicateurs-clés de performance. En septembre 2019, la migration est lancée par Vestiaire Collective avec ses seules forces internes. Airflow et Matillion servent à alimenter la base Snowflake en données et la restitution se fait avec Tableau. Lors de la mise en production, en décembre, une vingtaine de sources de données ont ainsi donné un volume disponible de 100 To de données, en constante augmentation.