Hortonworks, qui vient de proposer une version bêta de sa distribution Hortonworks Data Platform (HDP) Hadoop pour Windows, prévoit de livrer une version finale, prête pour l'entreprise, dans les mois à venir. Selon Hortonworks, en terme de fonctionnalités, sa version Windows de la plate-forme de traitement de données Open Source Hadoop sera à égalité avec la version Linux de la distribution. Pour le traitement des données non structurées, rappelons que Microsoft a choisi de travailler avec Hortonworks pour rendre accessible Hadoop en l'intégrant à System Center et à Active Directory. "Les personnes peuvent travailler sur du code MapReduce en JavaScript ou .net», nous avez expliqué Damien Cudel, chef de marché plateforme applicative chez Microsoft aux derniers Tech-days. L'arrivée d'une version Windows de Hadoop est donc dans l'ordre des choses.

HDP est « la première et la seule distribution de Hadoop disponible à la fois sur Linux et Windows », a déclaré David McJannet, vice-président du marketing de Hortonworks. Ce dernier a indiqué que l'éditeur avait pris en compte la forte demande d'utilisateurs se disant prêts à faire tourner une distribution de Hadoop sous Windows. « Cette demande de la part du marché a été le véritable catalyseur. La grande majorité des serveurs installés aujourd'hui dans les entreprises tournent sous Windows Server », a ajouté David McJannet. « Nos clients se sont dits très intéressés par l'usage de Hadoop sur la plate-forme qui prend en charge l'exécution de leurs applications critiques ».

18 mois de travail pour porter Hadoop sur Windows 

Au cours des 18 derniers mois, Hortonworks et Microsoft ont travaillé au portage du logiciel sur Windows. « Nous avons aussi réalisé des tests pour une utilisation en entreprise », a précisé le VP. La distribution HDP se compose de plusieurs logiciels différents, dont HDFS, MapReduce, Hive, Pig et d'autres. Comme pour la version Linux, HDP Windows sera disponible sous licence Open Source « pour que d'autres puissent en bénéficier et prolonger le travail que nous avons fait », a déclaré David McJannet. À l'avenir, Hortonworks publiera de nouvelles versions de HDP pour Linux et Windows.

Cette première version bêta pour Windows est basée sur le codebase de HDP 1,1. « À l'origine, la version bêta pour Windows ne disposait pas de fonctions en parité avec la version Linux, bien qu'elle comporte tous les « éléments de base » pour faire tourner Hadoop », a expliqué le VP du marketing. Mais elle ne comprend pas le set d'outils de gestion Ambari. Cependant, Hortonworks prévoit de répliquer toutes les fonctionnalités de la version Linux dans la version Windows. En effet, Hortonworks pense que les charges de travail réalisées sur la plate-forme Windows seront similaires à celles gérées sous Linux, en terme de taille et de champ d'application. « Nous anticipons le fait que les plus grands déploiements de Hadoop pourront se faire sous Windows », a affirmé David McJannet.

Impossible de mêler des clusters Linux et Windows

La distribution ne prend pas en charge l'exécution de noeuds Windows et de noeuds Linux dans le même déploiement. Ceux-ci devront être réalisés sous un système d'exploitation ou un autre, mais pas les deux. « Dans la pratique, il faut respecter l'homogénéité de l'infrastructure, mais nous verrons comment ce modèle évolue », a ajouté David McJannet. « Au fil du temps, Microsoft devrait apporter le support d'autres logiciels, notamment System Center, pour les entreprises qui voudront déplacer leurs charges de travail Windows Hadoop depuis leurs propres datacenter vers un service cloud Microsoft Azure », a déclaré Herain Oberoi, directeur du marketing produit de la division outils et serveurs de Microsoft.

Pour l'instant, Hortonworks n'a pas finalisé les versions de Windows Servers sur lesquelles tournera HDP. Mais la version bêta pourra tourner sous Windows Server 2008 et Windows Server 2012. Le produit ne fonctionne pas avec les versions desktop de Windows.