Pour la quatrième édition de l’Hadoop Summit (à Dublin, les 13 et 14 avril), 1 400 participants étaient inscrits à l’événement qui marque les 10 ans de la plate-forme open source lancée rappelons-le en 2006 avec HDSF et MapReduce. Depuis, le framework s’est considérablement étoffé, ainsi que son écosystème développé avec des intégrateurs, des partenaires et des clients toujours plus nombreux. Des banques françaises, des opérateurs et des hébergeurs français ont par exemple envoyé leurs responsables IT et métiers pour étudier des solutions déjà mises en oeuvre. Un représentant bancaire a ainsi expliqué qu’avec plus de 4 milliards d’enregistrements, il avait été obligé de passer à Hadoop pour gérer ses entrées.

Cette édition est donc une nouvelle fois l’occasion de découvrir et partager des informations et des retours d’expérience dans la banque, la distribution et le transport avec des focus sur la sécurité et l’Internet des objets. Herb Cunitz, le président d’Hortonworks, qui organise cet événement, a pointé lors de son keynote d’ouverture la nécessité de connecter les plates-formes de données pour établir une gouvernance globale. Un message également relayé par le CEO de l’éditeur, Rob Bearden, qui a précisé que les données transforment le monde de l’entreprise. « Il y a aujourd’hui des capteurs partout dans la maison, les rues et les entreprises avec des milliards de produits connectés. Les entreprises sont aujourd’hui directement reliées à leurs clients et produits, ce qui engendre de nouvelles opportunités si on sait les exploiter en transformant son système d’information pour accompagner ces nouveaux business ».

Herb Cunitz, président d'Hortonworks, mise aujourd'hui sur la cybersécurité pour développer son chiffre d'affaires.

Les décisions et ajustements peuvent désormais s’effectuer sans retard avec des informations plus précises. Les traitements médicaux lourds par exemple peuvent être affinés pour chaque patient. « Dans le monde de la distribution, la majorité des enseignes ont démarré des projets pour obtenir une vue à 360° de leurs clients avec six sources de données sur des plates-formes différentes consolidées sur HDP ». Le monde de l’assurance est également très actif avec des remontées d’informations en temps réel sur les conducteurs pour fournir des contrats personnalisés. « La transformation des business s’opère en ce moment, il est désormais devenu essentiel de débloquer la valeur des données », a poursuivi le CEO d’Hortonworks.

Les projets Apache toujours au coeur d'Hadoop 

Comme sur tous les salons, les annonces se sont succédées chez Hortonworks avec la présentation d’Apache Metron pour la cybersécurité, un partenariat étendu avec Pivotal sur HDP (Hortonworks data plateform), un autre avec Syncsort pour supporter les capacités ETL vers HDP depuis des mainframes et, enfin, l’intégration d’Apache Ranger et Apache Atlas dans HDP. Toujours chez Apache, Zeppelin vient proposer aux utilisateurs une interface reposant sur un navigateur web pour explorer et visualiser les données avec Spark. Autre annonce chez Hortonworks, l’arrivée de Cloudbreak 1.2 qui simplifie et automatise le provisionnement des clusters avec OpenStack pour les clouds privés et Windows Azure Storage Blob (WASB) de Microsoft.

Parmi les exposants, MapR a présenté MapR-DB, qui combine des traitements analytiques avec une base de données NoSQL sur Hadoop. Pentaho a dévoilé Business Analytics 6.1, qui vient simplifier et accélérer l’analyse des données dans un cluster Hadoop. De son coté, Teradata a annoncé que son initiative Think Big pour accompagner le déploiement de solutions big data reposant sur Apache Spark s’étend désormais au data lake. Enfin, Talend a annoncé que la compagnie aérienne Flybe a décidé de remodeler son back-office en s’appuyant sur la solution Talend Data Services. « Nous devions mettre en œuvre une solution stratégique pour l’intégration des données afin de connecter plusieurs systèmes auparavant isolés les uns des autres,  et proposer de nouvelles fonctionnalités d’interaction entre ces systèmes », déclare Mark Smith, responsable du développement digital et décisionnel chez Flybe. L’écosystème Hadoop se développe donc à bon pas même si certains marchés ont eu du mal à démarrer. Le dirigeant français d’une des principales distributions Hadoop nous avait confié que les deux précédentes années avaient été très dures avec la mise en œuvre de très nombreux POC dans des entreprises françaises sans engranger de contrats. Les choses ont toutefois changé depuis six mois, et l’évangélisation forcenée commence à porter ses fruits avec de belles signatures à la clef.