Microsoft travaille à la mise au point d'un connecteur qui permettra aux utilisateurs d'Excel de télécharger et d'analyser des données provenant de Hadoop. Cette fonctionnalité pourrait ouvrir à un public plus large la plate-forme de traitement de données disponible en Open Source. Le développement est réalisé en collaboration avec Hortonworks, une spin-off de Yahoo, qui propose une distribution de Hadoop avec un support commercial. « Cette annonce est importante, parce que Microsoft ouvre potentiellement Apache Hadoop à des millions de nouveaux utilisateurs », a déclaré Eric Baldeschwieler, co-fondateur et directeur technique d'Hortonworks. « Ce sont aussi plusieurs millions d'utilisateurs PowerPivot pour Excel qui vont bientôt pouvoir exploiter les capacités d'Apache Hadoop à partir d'un logiciel qu'ils connaissent bien. »

Le développement de ce connecteur est l'un des nombreux projets Open Source en relation avec Hadoop que Microsoft et Hortonworks ont annoncé mardi lors de la conférence O'Reilly Strata Data, qui se tient cette semaine (28 février-1er mars) à Santa Clara, Californie. L'an dernier, les deux entreprises avaient conclu un partenariat pour adapter Hadoop à l'écosystème Windows. Microsoft et Hortonworks travaillent également ensemble pour élaborer un framework JavaScript, qui permettra aux programmes JavaScript d'explorer les données de Hadoop. Il collaborent aussi sur une série de patchs pour le noyau Hadoop qui doit permettre au logiciel de tourner sur Windows Server.

Connecteur et bibliothèque bientôt en Open Source

Le connecteur est une interface ODBC (Online Database Connector) qui interagit avec Hadoop par l'intermédiaire du système d'entreposage de données Hive. Les utilisateurs pourront analyser les données téléchargées depuis Hive dans Excel, en utilisant des outils comme PowerPivot pour Excel. « Le pilote ODBC de Microsoft pour Hive a été construit pour connecter plus facilement Excel, PowerPivot et d'autres outils Microsoft à Hadoop (via Hive) », a déclaré par mail Shaun Connolly, vice-président, stratégie d'entreprise, d'Hortonworks. Il explique que sa société et Microsoft veulent mettre cette technologie en Open-Source afin qu'elle soit largement disponible et utilisée par la communauté Apache Hadoop. Le développement du framework JavaScript suivra le même chemin, a indiqué Shaun Connolly.

Microsoft a construit la plate-forme centrale pour ses propres produits et Hortonworks la modifiera pour permettre une utilisation élargie. « Pour l'instant, ni le connecteur, ni le framework Javascript ne sont disponibles, mais ils seront livrés prochainement en version open-source », a déclaré le vice-président de Hortonworks. Microsoft a déjà fait un pas pour intégrer Hadoop dans son écosystème puisque l'éditeur propose un connecteur Hadoop pour SQL Server. Il offre également la connectivité à une instance de Hadoop - actuellement en version développeur - sur son service cloud Azure.