Les projets IA nécessitent d'avoir les bonnes données. Dans ce cadre, Snowflake renforce encore les capacités d’Horizon Catalog, sa solution qui apporte un contexte et une gouvernance pour l'IA sur l'ensemble des données. Comment ? En mettant la main sur Select Star. Cet éditeur propose une plateforme d’analyse des métadonnées, des requêtes, et des logs en provenance d'outils tiers (Databricks, Google Big Query, Snowflake...), génère des modèles et trace les données ainsi que de la documentation, tout en détectant les informations personnelles identifiables. A l'occasion de son Summit 2025, le spécialiste en data store avait déjà étoffé Horizon Catalog avec, notamment, une fonction SQL basée sur l'IA pour détecter et masquer les informations personnelles identifiables (PII) dans les données non structurées, de la gestion de posture en sécurité des données, et plus de visibilité sur la traçabilité des données externes.
Select Star aide les entreprises à gérer et à comprendre leurs données à grande échelle en cataloguant automatiquement des ensembles de données, en traçant leur provenance de bout en bout, et en créant un glossaire métier partagé et une couche sémantique. Le but : fournir aux entreprises des données fiables à l'origine bien tracée pour leurs projets, en particulier IA (GenAI, agentique...).
Elargir la vision du patrimoine des données des entreprises
« La technologie Select Star apporte de la clarté dans les environnements complexes et fournit le contexte fiable nécessaire à l'IA, à l'analyse et à une gouvernance efficace des données », assure Snowflake dans un blog. « Les intégrations de Select Star avec des systèmes de bases de données tels que PostgreSQL et MySQL, des outils de veille économique tels que Tableau et Power BI, et des outils de pipeline/orchestration de données tels que dbt et Airflow nous aideront à élargir la vision qu'offre Horizon Catalog du patrimoine de données d'une entreprise [...] Ce contexte plus large aidera les solutions d'IA agentiques telles que Snowflake Intelligence et Cortex Code à comprendre en profondeur les données d'une entreprise et la manière d'en extraire des informations ».
Dans le cadre de ce rachat, dont le montant n’a pas été précisé, l’équipe de Select Star (une vingtaine de personnes en 2023) rejoindra celle de Snowflake. Fondé en 2020, Select Star a réalisé en 2023 un tour de table série A de 15 M$ menée par Lightspeed Venture Partners ainsi que les fonds Bowery Capital, Sozo Ventures et Pebblebed. Sa CEO, Shinji Kim, était auparavant dirigeante du fournisseur de services de traitement de données Concord Systems, racheté par Akamai fin 2016.