C’est un petit bouleversement dans le monde du big data. Cloudera et Hortonworks, deux des principaux éditeurs de plateformes big data et distributions Hadoop, ont décidé de fusionner leurs activités. Les Conseils d’administration des deux entreprises ont donné leur accord pour ce rapprochement. Les actionnaires de Cloudera détiendront environ 60% des parts de la nouvelle entité, ceux d’Hortonworks les 40% restants. La valorisation combinée des deux sociétés s'élevait à 5,2 milliards de dollars à la fermeture de la bourse le 2 octobre.

Sur son année fiscale close fin janvier 2018, Cloudera a généré 367,4 M$, en augmentation de 41% sur un an, tandis qu'Hortonworks a réalisé en 2017 un chiffre d’affaires de 261.8 M$, en hausse de 42% par rapport à 2016. Sur les 12 mois écoulés, les deux éditeurs annoncent des chiffres d’affaires respectifs de 411 M$ et 309 M$.

Hortonworks et Cloudera présentent leurs offres comme complémentaires, depuis les solutions d'ingestion de données, de streaming et d'IoT (à déployer en bout de réseau) jusqu’aux outils de data science et d’apprentissage machine, en passant par la gestion des données et le datawarehouse. Le tout à travers les déploiements sur site, dans le cloud et hybrides.

A l’issue de cette fusion, le comité exécutif sera remanié. Le CEO de Cloudera, Tom Reilly, gardera cette fonction dans la nouvelle entité. Celui d’Hortonworks, Rob Bearden, rejoindra le conseil d’administration. Le COO d’Hortonworks, Scott Davidson, gardera son poste, tout comme Arun C. Murthy, le CPO d’Hortonworks. De même, Jim Frankola, CFO de Cloudera, conservera le poste de directeur financier dans la nouvelle entreprise. Le Conseil d’administration va également être revu. La présidence sera assurée par Marty Cole, qui était jusque-là membre du conseil d'administration de Cloudera. Le board est pour l'instant constitué de neuf membres : quatre issus d’Hortonworks et cinq de Cloudera. Un dixième membre sera choisi par ce nouveau bureau.

Transaction finalisée début 2019

Ayant des offres jugées complémentaires, les deux sociétés estiment que l'entité combinée a davantage de chances de devenir une plate-forme de données de nouvelle génération sur plusieurs clouds, sur site et dans l’edge computing. Ce regroupement portera le chiffre d'affaires à environ 720 millions de dollars, avec plus de 2 500 clients et environ 500 millions de dollars en trésorerie. Cloudera et Hortonworks espèrent finaliser la fusion d’ici le premier trimestre 2019.

Les deux éditeurs estiment que leur fusion va permettre de créer une plateforme unifiée qui accélérera leur développement sur le marché et l’innovation dans les domaines de l’IoT, du streaming, du datawarehouse, du cloud hybride et de l’intelligence artificielle. Ils tablent sur une extension des opportunités commerciales par le rapprochement de leurs offres complémentaires, avec notamment DataFlow d’Hortonworks et Data Science Workbench de Cloudera. Les deux éditeurs estiment qu’ils évoluent sur un marché dont le potentiel va atteindre 83 milliards de dollars en 2022.

Atouts comparés de Cloudera et Hortonworks

L’intégration avancée d’Apache Spark figurent au nombre des spécificités de l’offre Cloudera, avec l’utilisation de Spark Streaming, Spark MLlib et Spark SQL, pour la gestion des flux de données en temps réel, l’apprentissage machine et la recherche de données via SQL. L'éditeur fournit par ailleurs des outils de gouvernance de données à travers Cloudera Navigator. De son côté, Hortonworks apporte des capacités de provisionnement automatique et de stockage natif dans le cloud avec la version 3.0 de sa plateforme HDP. Cette dernière recourt à Apache Hive pour les requêtes SQL interactives et supporte le traitement par GPU. Par ailleurs, HDP 3.0 permet d’exécuter les applications en conteneurs Docker en tant que tâches YARN à côté des charges Hadoop classiques. Le principal concurrent de Cloudera et Hortonworks, l’éditeur MapR - qui fut le 3ème pionnier des fournisseurs de solutions Hadoop – fait lui aussi valoir les particularités de son offre sur la sécurité, les conteneurs et l’apprentissage machine (cf les atouts comparés des trois offres).

Hortonworks est entré en bourse en décembre 2014 et Cloudera a fait son IPO deux ans et demi plus tard, en avril 2017.