A l’occasion de son évènement à New York en fin de semaine dernière, AWS a fait plusieurs annonces autour de l’IA dont le service Entity Resolution. Ce dernier vise à améliorer la qualité des données pour les tâches d'analyse et d'IA des entreprises. « Basé sur le machine, le service aide les professionnels à faire correspondre des données provenant de plusieurs datalake ou du stockage AWS », a déclaré Davor Golac, directeur général du service chez AWS. Le service est accessible via une interface no-code dans la console de gestion. « Il peut aider les entreprises à dépenser moins d’argent pour résoudre les problèmes liés à la qualité des données », a ajouté le dirigeant. Rien qu'aux États-Unis, celles-ci consacrent environ 3,1 Md$ par an pour améliorer la qualité des données.

Une concordance des données

« Contrairement à la pratique qui consiste à développer, intégrer et gérer des pipelines de données complexes pour le rapprochement des informations, l'interface no-code du service d’AWS peut, avec l'aide de l'apprentissage machine, être utilisée soit pour adopter des workflows préconfigurés, soit pour en créer des personnalisés basés sur des règles pour le rapprochement des données et avec la précision nécessaire », a déclaré le fournisseur. Les clients peuvent fixer un seuil plus élevé pour obtenir des correspondances exactes, ou un seuil plus bas pour faire correspondre les données à un ensemble plus large de résultats.

« Une fois le seuil défini, le modèle ML du service prend le relais et identifie les données ayant des attributs similaires avant de les regrouper et de générer une sortie de données normalisées dans le stockage AWS S3 », a expliqué Dave Golac, qui compare les principes du service à la recherche vectorielle ou sémantique. « Les données normalisées en sortie peuvent servir pour des tâches d'analyse ou d'intelligence artificielle », a-t-il ajouté. Selon AWS, l'outil Entity Resolution évite également aux entreprises d'avoir à embaucher des développeurs et de passer des mois à développer leur propre modèle d'apprentissage machine pour le nettoyage ou la normalisation des données.

D’autres sources de données en vue

Le service est généralement disponible et accessible dans plusieurs régions AWS, notamment dans les régions États-Unis Est (Ohio), États-Unis Est (Virginie du Nord), États-Unis Ouest (Oregon), Asie Pacifique (Séoul), Asie Pacifique (Singapour), Asie Pacifique (Sydney), Asie Pacifique (Tokyo), Europe (Francfort), Europe (Irlande) et Europe (Londres). « La disponibilité dans d'autres régions suivra bientôt », a déclaré l'entreprise. AWS Entity Resolution est actuellement pris en charge sur Amazon S3 Storage. Le fournisseur facture le nombre d'enregistrements traités par workflow à 0,25 dollar HT pour 1 000 enregistrements.

« La prise en charge d'autres sources de données devrait suivre dans les mois à venir », a indiqué M. Golac. De plus, AWS a intégré le service dans les offres de la plateforme de connectivité de données LiveRamp, de l'agence américaine d'évaluation du crédit à la consommation TransUnion et du framework publicitaire open source Unified ID 2.0. L’an dernier, pendant la conférence annuelle re:Invent, le fournisseur avait laissé entendre qu'il lancerait un service baptisé Identity Resolution en même temps qu’il annonçait son service Data Clean Rooms. « Il s’agit bien du service prévu, mais il a été rebaptisé et lancé sous le nom d’Entity Resolution », conclut Dave Golac.