Avec plus de 30 000 inscrits pour sa 2e édition de BIG 2016, Bpifrance a réuni start-ups, ETI, grands comptes et entrepreneurs.

L'Image du jour

Avec plus de 30 000 inscrits pour sa 2e édition de BIG 2016, Bpifrance a réuni start-ups, ETI, grands comptes et entrepreneurs.

Cybersécurité : quels outils pour contrer les nouvelles menaces

Dernier Dossier

Cybersécurité : quels outils pour contrer les nouvelles menaces

Les événements récents autour du ransomware Locky et du vol massif de données du cabinet panaméen Mossack Fonseca dans l'affaire des « Panama Papers »...

Restez proche de l'actualité IT

NEWSLETTERS THEMATIQUES

Découvrez nos différentes newsletters adaptées à vos besoins d'actualités IT Pro : Mobilité, Réseaux, Stockages, ...

Abonnez-vous 
FERMER

LMI MARKET

Votre comparateur de prestataires IT : Comparez les devis, Evaluez les prestataires, Trouvez le juste prix!...

Accéder à ce service 

BLOG

Découvrez les contenus exclusifs publiés par les lecteurs du Monde Informatique avec la plateforme LMI Blog...

Accéder à ce service 

COMPARATEUR DE SALAIRE

Partagez votre situation salariale anonymement, consultez les statistiques depuis 2009 et faites vos propres analyses...

Accéder à ce service 

IT TOUR

LMI vous invite à sa Matinée-Débats dans votre région.
Inscrivez-vous

Accéder au site 
FERMER
0
Réagissez Imprimer Envoyer

Trifacta vient transformer les données big data avant leur traitement analytique

Sean Kandel, CTO et cofondateur de Trifacta lors d'une démonstration de son logiciel à San Francisco. (crédit : SL)

Sean Kandel, CTO et cofondateur de Trifacta lors d'une démonstration de son logiciel à San Francisco. (crédit : SL)

Mettre un peu d'ordre avant tout traitement analytique est l'ambition de la start-up Trifacta, spécialisée dans l'organisation des données non structurées stockées sur un cluster Hadoop.

En direct de San Francisco - Fondée en 2012, Trifacta a déjà réussi à se faire un nom dans le petit monde du big data avec son logiciel Wrangler Enterprise (et son langage spécifique Wrangle) dédié à la préparation des données stockées sur une plate-forme Hadoop (MapReduce et Spark) avant le traitement analytique. Le big data est entré dans une nouvelle phase. Les entreprises exploitent depuis très longtemps leurs données afin de prendre de meilleures décisions. Aujourd’hui, elles veulent utiliser des données non structurées et développer l'analytique dans plusieurs domaines. Le logiciel de Trifacta automatise le processus d'organisation des données afin qu'il puisse être introduit dans les produits de business intelligence – comme Tableau, QlikView ou Tibco - ou être utilisé par les data scientists qui veulent définir les modèles analytiques. Trifacta propose d’éliminer le goulet d'étranglement dans les entreprises qui tentent d’exploiter toutes les données à leur disposition afin d’élargir les traitements analytiques prédictifs comme chez Pepsico. L’exploitation des informations météo croisées avec les résultats dans les points de vente permet en effet à Pepsico d’affiner les livraisons pour éviter de perdre du chiffre d’affaires en cas de rupture de stock. En remplacement d'Excel et d'Access, Pepsi utilise la solution de Trifacta pour préparer ses données avant le passage à la moulinette analytique prédictive. Royal Bank of Scotland exploite de son coté Trifacta pour organiser puis analyser les conversations en tchat entre les clients et ses employés afin de savoir si les réponses ont été pertinentes. Les web logs représentent ici des gigaoctets de données. Avant de choisir notre solution, RBS ne pouvait tout simplement pas le faire, nous a indiqué le directeur marketing de Trifacta, Bertrand Cariou.

Trifacta Wrangler Enterprise se concentre actuellement sur le marché Hadoop, principalement utilisé sur site. Les clients exploitent le logiciel Trifacta en combinaison avec la visualisation des données et des produits de BI comme Tableau et QlikView. Toutefois, s'ils commencent à recourir à des outils BI et Hadoop basées sur le cloud ou hébergé, ils peuvent toujours utiliser Trifacta pour organiser leurs données et les envoyer aux services de cloud computing. Le système de Trifacta est hybride. Les données restent en local et les métadonnées sont stockées sur le cloud. Le prix de la solution commence à 20 000 dollars mais le tarif dépend du nombre de nœuds et d’utilisateurs.

Un solution hybride gratuite pour poste de travail 

En complément, la start-up pousse Trifacta Wrangler. Gratuit, le logiciel a pour but de permettre à n’importe quel utilisateur de travailler avec des données issues d’Excel ou des outils d'analyse visuelle tels que Tableau. Trifacta apporte des fonctions de recherche couplées à des algorithmes d'apprentissage machine (avec près de 6 000 utilisateurs dans le monde remontant des informations) pour affiner la visualisation de données. L’idée est d’apporter à tous les utilisateurs la possibilité de découvrir, de structurer, d'enrichir, de valider et de publier leurs données à des fins d’analyse et, ce, en local. Les utilisateurs n'ont besoin que d'un ordinateur Mac ou Windows et d’une connexion Internet pour télécharger et installer Trifacta Wrangler. L'architecture hybride du logiciel permet aux utilisateurs de traiter les données localement sans jamais les envoyer à Trifacta. Les mises à jour logicielles, quant à elles, sont poussées vers l'utilisateur en mode cloud. Bien que Trifacta ait été développé pour travailler avec l’écosystème Hadoop, l’extension de la plate-forme est une nouvelle direction. D’autres vont venir, nous a précisé le CEO.

La préparation des données est l'un des défis majeurs dans l'analyse aujourd'hui. Si les données arrivent dans un désordre apparent, il est nécessaire de passer par une étape. Si les données ne sont pas bien classées et organisées, les réponses pourraient être erronées. « Les données non structurées ont toutes une forme de structure héritée de leur source » nous a expliqué Sean Kandel, CTO et cofondateur de Trifacta. « L'idée est de comprendre cette structure avec Trifacta, transformer pour organiser les données avec un profilage interactif. Nous avons une prévisualisation des données dans notre interface web mais nous ne cherchons pas à concurrencer Tableau ou Qlik ».

GoPro utilise déjà la solution

Beaucoup d'entreprises, comme Informatica, Paxata ou même Datameer (également visité par la rédaction de LMI cette semaine), tentent de répondre à ce besoin d’organisation des données mais Trifacta est allée très loin en rendant plus facile ce travail de préparation. Il n’est ainsi pas nécessaire d’être un datascientist ou d’avoir 10 ans d’expérience dans l’analytique pour utiliser le logiciel. Parmi les clients de Trifacta, outre Royal Bank of Scotland et Pepsico déjà cités figurent notamment Orange, Santander, GoPro, UniCredit ou encore Pfizer. La start-up, qui a déjà levé 76,3 millions de dollars, compte ouvrir très bientôt un bureau en France.

Article de

Sur le même sujet (Trifacta)

Commenter cet article

commenter cet article en tant que membre LMI

CONNEXION

Commenter cet article en tant que visiteur






* Les liens HTML sont interdits dans les commentaires

Publicité
Publicité
Publicité