En direct de San Francisco - Fondée en 2012, Trifacta a déjà réussi à se faire un nom dans le petit monde du big data avec son logiciel Wrangler Enterprise (et son langage spécifique Wrangle) dédié à la préparation des données stockées sur une plate-forme Hadoop (MapReduce et Spark) avant le traitement analytique. Le big data est entré dans une nouvelle phase. Les entreprises exploitent depuis très longtemps leurs données afin de prendre de meilleures décisions. Aujourd’hui, elles veulent utiliser des données non structurées et développer l'analytique dans plusieurs domaines. Le logiciel de Trifacta automatise le processus d'organisation des données afin qu'il puisse être introduit dans les produits de business intelligence – comme Tableau, QlikView ou Tibco - ou être utilisé par les data scientists qui veulent définir les modèles analytiques. Trifacta propose d’éliminer le goulet d'étranglement dans les entreprises qui tentent d’exploiter toutes les données à leur disposition afin d’élargir les traitements analytiques prédictifs comme chez Pepsico. L’exploitation des informations météo croisées avec les résultats dans les points de vente permet en effet à Pepsico d’affiner les livraisons pour éviter de perdre du chiffre d’affaires en cas de rupture de stock. En remplacement d'Excel et d'Access, Pepsi utilise la solution de Trifacta pour préparer ses données avant le passage à la moulinette analytique prédictive. Royal Bank of Scotland exploite de son coté Trifacta pour organiser puis analyser les conversations en tchat entre les clients et ses employés afin de savoir si les réponses ont été pertinentes. Les web logs représentent ici des gigaoctets de données. Avant de choisir notre solution, RBS ne pouvait tout simplement pas le faire, nous a indiqué le directeur marketing de Trifacta, Bertrand Cariou.

Trifacta Wrangler Enterprise se concentre actuellement sur le marché Hadoop, principalement utilisé sur site. Les clients exploitent le logiciel Trifacta en combinaison avec la visualisation des données et des produits de BI comme Tableau et QlikView. Toutefois, s'ils commencent à recourir à des outils BI et Hadoop basées sur le cloud ou hébergé, ils peuvent toujours utiliser Trifacta pour organiser leurs données et les envoyer aux services de cloud computing. Le système de Trifacta est hybride. Les données restent en local et les métadonnées sont stockées sur le cloud. Le prix de la solution commence à 20 000 dollars mais le tarif dépend du nombre de nœuds et d’utilisateurs.

Un solution hybride gratuite pour poste de travail 

En complément, la start-up pousse Trifacta Wrangler. Gratuit, le logiciel a pour but de permettre à n’importe quel utilisateur de travailler avec des données issues d’Excel ou des outils d'analyse visuelle tels que Tableau. Trifacta apporte des fonctions de recherche couplées à des algorithmes d'apprentissage machine (avec près de 6 000 utilisateurs dans le monde remontant des informations) pour affiner la visualisation de données. L’idée est d’apporter à tous les utilisateurs la possibilité de découvrir, de structurer, d'enrichir, de valider et de publier leurs données à des fins d’analyse et, ce, en local. Les utilisateurs n'ont besoin que d'un ordinateur Mac ou Windows et d’une connexion Internet pour télécharger et installer Trifacta Wrangler. L'architecture hybride du logiciel permet aux utilisateurs de traiter les données localement sans jamais les envoyer à Trifacta. Les mises à jour logicielles, quant à elles, sont poussées vers l'utilisateur en mode cloud. Bien que Trifacta ait été développé pour travailler avec l’écosystème Hadoop, l’extension de la plate-forme est une nouvelle direction. D’autres vont venir, nous a précisé le CEO.

La préparation des données est l'un des défis majeurs dans l'analyse aujourd'hui. Si les données arrivent dans un désordre apparent, il est nécessaire de passer par une étape. Si les données ne sont pas bien classées et organisées, les réponses pourraient être erronées. « Les données non structurées ont toutes une forme de structure héritée de leur source » nous a expliqué Sean Kandel, CTO et cofondateur de Trifacta. « L'idée est de comprendre cette structure avec Trifacta, transformer pour organiser les données avec un profilage interactif. Nous avons une prévisualisation des données dans notre interface web mais nous ne cherchons pas à concurrencer Tableau ou Qlik ».

GoPro utilise déjà la solution

Beaucoup d'entreprises, comme Informatica, Paxata ou même Datameer (également visité par la rédaction de LMI cette semaine), tentent de répondre à ce besoin d’organisation des données mais Trifacta est allée très loin en rendant plus facile ce travail de préparation. Il n’est ainsi pas nécessaire d’être un datascientist ou d’avoir 10 ans d’expérience dans l’analytique pour utiliser le logiciel. Parmi les clients de Trifacta, outre Royal Bank of Scotland et Pepsico déjà cités figurent notamment Orange, Santander, GoPro, UniCredit ou encore Pfizer. La start-up, qui a déjà levé 76,3 millions de dollars, compte ouvrir très bientôt un bureau en France.