Trifacta affiche son ambition de démocratiser le data wrangling, cette étape de collecte et de préparation des données destinées à alimenter les applications analytiques. Pour y parvenir, l’éditeur basé à San Francisco vient de réaliser un 6ème tour de table (série D) de 48 millions de dollars auprès de 10 investisseurs, dont Google qui a retenu la technologie pour son service Cloud DataPrep. Ont également participé à cette levée Deutsche Börse et New York Life, deux clients de Trifacta, ainsi que Columbia Pacific et Ericsson, nouveaux venus aux côtés des investisseurs historiques Accel, Cathay Innovation, Greylock Partners, Ignition Partners et Ridge Ventures. Au total, Trifacta aura levé 124 M$ depuis sa création en octobre 2012 par Joe Hellerstein, Sean Kandel et Jeffrey Heer.

La croissance de la société s’est accélérée sur les six derniers mois. Selon l’éditeur, sa solution est maintenant exploitée par plusieurs dizaines de milliers d’utilisateurs. Par rapport aux outils de transformation traditionnels de type ETL, elle s’adresse tout autant aux data scientists qu’aux utilisateurs métiers, nous avait exposé Adam Wilson, le CEO de Trifacta, lors d’une rencontre à Paris. Elle permet d’explorer visuellement les sources de données et de mettre en place des règles pour les transformer et les nettoyer de façon interactive, à partir d’un échantillon. La plateforme s’appuie sur l’apprentissage machine pour faciliter l’ensemble des processus de préparation.

Accessible sur AWS adossée à S3 et Redshift

Depuis novembre, les offres Wrangler Edge et Wrangler Enterprise sont proposées sur la marketplace d’AWS où elles peuvent être utilisées avec le service de stockage S3 du cloud public, ainsi qu’avec Elastic MapReduce et Amazon Redshift. Sur AWS, Trifacta fait également partie du programme de compétences Machine Learning, attestant de son expertise pour assister les clients sur les workloads d’apprentissage machine dans le cloud public d’Amazon. Trifacta a par ailleurs été certifié par Microsoft pour fonctionner avec son offre Hadoop Azure HDInsights.

Parmi les entreprises ayant récemment adopté les outils de data wrangling de l’éditeur californien figurent Bank of America, Royal Bank of Scotland et Commerzbank (2ème banque en Allemagne), mais aussi PepsiCo, eBay, Enstar, The Centers for Disease Control, BNSF Railway Company et Nordea Bank. Les outils de Trifacta sont aussi disponibles dans une version gratuite, ce qui conduit son éditeur à revendiquer son utilisation dans 10 000 entreprises au total.