En décembre dernier, nous avons rencontré une partie de l'équipe d'Elastic à Los Alto, à savoir Shay Banon, créateur, co-fondateur et CTO, Gaurav Gupta, vice-président en charge des produits, et Aaron Katz, senior vice-président en charge des opérations monde. En 2004, Shay Banon avait déjà lancé Compass, et Aaron Katz était auparavant directeur des ventes Europe chez Salesforce.com. Le siège d'Elastic est situé à Amsterdam, aux Pays-Bas, tout comme son CEO et co-fondateur, Steven Schuurmann.

Fondée en 2012, Elastic propose un moteur de recherche et d'analyse distribuée en temps réel qui permet l'exploration et la visualisation de données sur une grande échelle avec l'outil Kibana. Elastic repose sur le projet Open Source Lucene, piloté par la Fondation Apache. En complément, la start-up fournit un ETL (Extract, Transform et Load) baptisé Logstash, qui assure la collecte et le formatage des données en JSON. La jeune pousse qui a déjà levé plus de 100 millions de dollars au cours des 24 derniers mois - auprès de Benchmark Capital, Index Ventures et New Enterprise Associates - travaille déjà avec Intuit, Yelp et Facebook aux États-Unis, la Société Générale, Nuxeo et Dailymotion en France, ou encore TomTom en Hollande. Son moteur de recherche a déjà été téléchargé plus de 11 millions de fois.

« Des milliards de données sont crées tous les jours par les utilisateurs et les machines. Notre solution propose d'aider les entreprises à analyser leurs données, tant structurées que non-structurées, et à en extraire une valeur exploitable pour leur business », nous a expliqué en introduction Gauray Katz. « L'objectif est d'analyser rapidement n'importe quel type de données ». Si Hadoop est venu répondre à une problématique bien précise, l'explosion du volume de données avec l'introduction de MapReduce par Doug Cutting pour réduire les données avant le traitement analytique, Elastics'attaque à un problème supplémentaire : comment comprendre plus rapidement des datasets (bases de données objets), nous a indiqué Shay Banon. « Cloudera essaye de répondre à ça avec Impala qui assure des traitements en 10 minutes. Nous essayons de réduire le délai à 100 ms - voir même 10 ms -  en utilisant des technologies in-memory ».

Un algorithme d'apprentissage machine mis au point

Si le moteur repose sur une plate-forme Open Source, Elasticsearch commercialise plusieurs connecteurs ainsi que des plug-ins (notamment Marvel pour suivre et gérer ses grappes de cluster Elasticsearch), ainsi que des formations et du support autour de son produit. L'offre peut être déployée en interne ou dans le cloud suivant les cas de figures. Les tweets de clients qui signalent un Dab hors service peuvent être repérés afin de localiser plus rapidement le distributeur de billets défaillant. La solution d'Elastic peut également être utilisée pour la détection de fraudes grâce à l'analyse des données criminelles dans une région. Shay Banon nous a en effet expliqué avoir mis au point un algorithme d'apprentissage machine capable de déceler des tendances ou des valeurs aberrantes dans une région donnée. « Si Elasticsearch regroupe des fonctions de recherche, BI et autres dans un seul outil, nous ne réglons pas tous. Le contexte de recherche reste encore très important, avec notamment l'adaptation aux langues », a conclu M. Gupta.