Après Google pour son service cloud Dataprep, c'est au tour d'AWS de faire les yeux doux à la start-up américaine Trifacta - que nous avions rencontrée à plusieurs reprises à San Francisco - spécialisée dans la préparation des données brutes avant exploitation. A l'occasion de l'événement re:Invent qui se déroule en ce moment à Las Vegas (27 novembre-1er décembre), la jeune pousse a ainsi annoncé la disponibilité de ses solutions de préparation de données Wrangler Edge et Enterprise pour plusieurs services cloud AWS, à savoir S3, Redshift for ML ainsi que plusieurs applications de datavisualisation dont QuickSight.

Wrangler Edge cible les besoins en data wrangling des entreprises de taille intermédiaire ou pour des besoins verticaux (jusqu'à 30 utilisateurs et 40 Go de données par workflow), tandis que l'offre Enterprise vise les besoins en traitements de données beaucoup plus volumineux requérant de la puissance de calcul parallélisée rendue possible en s'intégrant au service Elastic MapReduce d'AWS.

Le data wrangling, fondement des traitements d'apprentissage machine

Trifacta a aussi annoncé avoir atteint le statut Machine Learning Competency, démontrant la capacité de la société et ses produits à déployer les workloads sur AWS. « Les données de préparation propres et annotées constituent le fondement de l'apprentissage automatique moderne », a déclaré Joseph Spisak, responsable mondial des partenariats d'apprentissage machine chez Amazon Web Services. « Il alimente les algorithmes de pointe en vision par ordinateur et en langage naturel. Cependant, l'acquisition de données d'entraînement propres et annotées prend du temps et des ressources. Nous sommes très enthousiastes à l'idée que Trifacta rejoigne le programme de compétences machine learning pour aider nos clients à passer moins de temps à préparer leurs données et plus de temps à créer de l'intelligence. »