Avec son service Kendra, en disponibilité générale depuis hier aux Etats-Unis et en Europe de l’ouest, Amazon Web Services applique l’apprentissage machine aux outils de recherche en entreprise, en commençant par l’indexation des différentes sources de données internes, structurées et non structurées. Et en poursuivant avec les requêtes des utilisateurs qui se font en langage naturel, en anglais. Les algorithmes de machine learning sont alors mis à contribution pour comprendre le contexte et essayer de retourner les réponses ou documents les plus proches de la demande. Le service a été annoncé en décembre et concurrence les outils basés sur ElasticSearch, AWS ayant lui-même sorti sa propre distribution du moteur de recherche open source il y a un an. 

Avec Kendra, les développeurs indexent rapidement les sources les plus courantes - SharePoint, OneDrive, Salesforce, ServiceNow, Amazon Simple Storage Service, databases - pour déployer des fonctions de recherche sur les contenus sans avoir à coder, indique AWS. L’ajout de sources de contenus se fait au travers de connecteurs qui maintiennent les droits d’accès aux documents et se programment pour synchroniser les index et les sources afin d’avoir toujours le dernier contenu en date. Les données sont chiffrées en transit et au repos. Mi-avril, AWS a expliqué comment intégrer son chatbot Lex avec Kendra, ce dernier pouvant extraire des réponses au sein d’un document (un FAQ typiquement), ou retourner un lien vers le document complet. 

Optimisé pour plusieurs domaines dont l’IT

Le service a été optimisé son service pour qu’il puisse comprendre les principaux termes liés à certains domaines ou secteurs d’activité. Cela va de l’informatique aux soins et sciences de la vie, en passant par l’assurance, l’énergie, l’industrie, les services financiers et juridiques, les transports, l’hôtellerie, les ressources humaines, les télécommunications, les mines, l’agro-alimentaire, l’automobile. Parmi les clients d’AWS qui l’ont déjà testé figurent par exemple le fabricant d’abrasifs 3M, le cabinet de conseil PwC, l’institut de bioscience Allen, ainsi qu’un groupe d’assurance, Baker Tilly.

La mise en place de Kendra dans les entreprises se fait à travers une console d’administration, qui servira aussi pour établir les permissions d’accès aux documents conformément à la politique de sécurité de l’entreprise. En Europe, le service est accessible depuis les datacenters d’AWS situés en Irlande. Côté tarification, AWS donne un exemple pour Kendra Enterprise basé sur la création d’un index sur 400 000 documents à partir d’un système de gestion de contenus, avec 25 000 recherches par jour. Seule l’API d’ingestion Kendra est utiliser pour synchroniser les documents. Le coût revient à 7 dollars de l’heure (soit un peu plus de 5 000 dollars par mois sur 720 heures). Dans d’autres cas de figures, il faut ajouter le coût des connecteurs pour l’analyse et la synchronisation. AWS prévoit une offre gratuite de 30 jours pour l’offre Kendra Developer Edition, sans connecteur.