Selon une étude récente du cabinet d’études Forrester Research, passer au framework Hadoop devient obligatoire pour toute entreprise qui souhaite faire des analyses avancées de données pour disposer d'informations qu'elle pourra vraiment exploiter. Forrester estime qu’entre 60 et 73% des données auxquelles les entreprises ont accès ne sont pas utilisées par les outils d’analyse. Pour Mike Gualtieri et Noël Yuhanna, les auteurs du rapport Wave sur les distributions Hadoop sorti cette semaine, « c’est inacceptable dans un contexte où une connaissance approfondie des données, en particulier sur les clients, sont une nécessité face à la concurrence. » Selon eux, les développeurs d’applications et les professionnels de la livraison de colis adoptent en masse le framework d’analyse des big data et ils prédisent que 100% des grandes entreprises le feront à terme. Malgré tout, le marché est complexe et il reste difficile de déterminer quelle distribution choisir.

Le Top 5 des distributions Hadoop réunit bien sûr Cloudera, Hortworks et MapR, auxquels Forrester ajoute IBM et Pivotal. Pour le cabinet d’études, il n’y a pas d’éditeurs qui se détache de façon indiscutable - même si Cloudera arrive en tête selon ses critères - mais plutôt un ensemble de fournisseurs qui apportent chacun leurs compétences, avec des points forts différents. Chacun d’entre eux concentre sa propre solution sur des fonctionnalités clés pour l’entreprise comme la sécurité, l’évolutivité, l’intégration, la gouvernance et la performance. Les cinq produits peuvent être installées sur site, dans un cloud privé ou s’utiliser dans un cloud public, mais ce sont les clients qui gèrent le logiciel. Le rapport Wave de Forrester n’évalue pas les distributions Hadoop proposées dans le cloud telles qu’Elastic MapReduce d’Amazon Web Services ou HDInsight de Microsoft Azure, parce qu’il s’agit de solutions que l’on ne peut utiliser que dans le cloud et pas sur site.

Hortonworks, 2ème en termes de présence sur le marché

Cloudera, fondé en 2008, est présenté comme leader dans le rapport en totalisant le score le plus élevé pour son offre actuelle et sa présence sur le marché, une estimation basée sur l’évaluation de 30 critères utilisés par Forrester pour comparer les éditeurs. Cloudera prend la version open source de Hadoop et lui apporte certains changements propriétaires pour en améliorer la sécurité, la haute disponibilité, la gouvernance et l’administration, rappelent les analystes. Hortonworks arrive second en termes de présence sur le marché. Cet éditeur propose une distribution d’Hadoop entièrement open source. Cela donne aux utilisateurs la flexibilité maximale en cas de migration vers une autre plateforme, mais cela se fait aux dépens de quelques fonctionnalités. Ainsi, lorsque Cloudera atteint l’indice de 4.53 sur une échelle de 1 à 5, Hortonworks n’arrive qu’à 3.82.

MapR, lui, affiche 4.34, soit le 2ème meilleur score sur son offre actuellement commercialisée. Selon Mike Gualtieri et Noël Yuhanna, l’éditeur apporte le meilleur équilibre entre la haute disponibilité et l’évolutivité, tout en maximisant la facilité d’utilisation. Réagissant immédiatement à la publication du rapport de Forrester, MapR présente sa Converged Data Platform comme la seule à combiner la puissance de Hadoop et de Spark avec des capacités de base NoSQL et de gestion des flux événements en temps réel.

IBM et Pivotal dans le 2ème cercle

IBM est un concurrent solide, en particulier sur sa base installée de clients cherchant à étendre leurs solutions analytiques en incluant Hadoop. L’offre de Pivotal vaut aussi la peine d’être prise en compte, mais la solution actuellement proposée et la présence sur le marché de son éditeur la font arriver en dernière position de ce Top 5. Cette distribution s’intègre bien avec les environnements des clients utilisant les autres produits et services de Pivotal, tels que la plateforme de développement d’applications Cloud Foundry et le logiciel de gestion de données Greenplum.

Cela dit, le marché n’est pas encore saturé par les utilisateurs d’Hadoop. L’an dernier, Merv Adrian, analyste de Gartner, a cherché à temporiser le battage médiatique fait autour du framework. Dans une enquête sur le sujet faite par le cabinet d’études, 54% des répondants indiquaient qu’ils ne prévoyaient pas d’adopter Hadoop sur l’année.