Microsoft va collaborer avec Hortonworks pour développer la mise en oeuvre du framework Apache Hadoop sur son environnement Windows Server et sa plateforme cloud Azure. Cette société, issue de Yahoo, lui apportera son expertise pour intégrer Hadoop dans Windows. On savait depuis cet été que l'éditeur de Redmond s'était attelé à ce projet, l'équipe de SQL Server ayant publié un billet à ce sujet sur son blog officiel.

Une pré-version du service pour Azure est prévue pour la fin de cette année, a indiqué Microsoft sur sa conférence utilisateurs PASS Summit consacrée à SQL Server (du 11 au 14 octobre à Seattle). Tandis que celle destinée à Windows Server arrivera courant 2012 et fonctionnera avec les outils de Business Intelligence de Microsoft. Ces outils permettront aux clients de l'éditeur de mieux appréhender la prise en compte des Big Data (flux d'informations remontés des capteurs, des connexions web, données non structurées provenant des réseaux sociaux, fichiers vidéo, etc.), a confirmé Ted Kummert, vice-président corporate de la division Plateforme Business de Microsoft.

Oracle a aussi adopté Hadoop et IBM racheté Platform Computing

La semaine dernière, dans ce domaine, Oracle a annoncé la solution Big Data Appliance (matériel + logiciel) qui exploite également Hadoop, ainsi qu'une base de données NoSQL maison et une distribution du langage de programmation R pour l'analyse statistique, afin de pouvoir traiter les volumes de données importants.

Hier, IBM a de son côté annoncé le rachat de l'éditeur canadien Platform Computing, spécialisé sur la gestion des clusters et des traitements en grille dans les environnements distribués, dans lesquels Hadoop est typiquement exploité. Ce framework Open Source, qui supporte les applications portant sur les Big Data, suscite de plus en plus l'intérêt des responsables informatiques pour ses capacités à traiter les énormes flux de données qu'ils doivent prendre en compte. Un nombre croissant d'entreprises cherche à les collecter afin de les analyser pour en tirer des informations significatives pour les activités. Jusqu'à présent, elles se trouvaient limitées pour le faire par les limites des bases de données relationnelles traditionnelles, avant tout conçues pour manipuler les données structurées.

Les premiers à l'avoir adopté, parmi lesquels Yahoo, AOL, Google et d'autres, se sont servis d'Hadoop pour stocker et analyser des petaoctets d'informations non structurées. Les autres technologies de datawarehouse se sortent moins bien de ce type de traitements.

Une belle visibilité pour Hortonworks

Pour Merv Adrian, analyste au Gartner interrogés par nos confrères de Computerworld, l'alliance entre Microsoft et Hortonworks n'est pas surprenante. Pour lui, chacun des principaux fournisseurs de base de données doit prendre garde de ne pas amener les clients qui voudront s'atteler aux Big Data à puiser dans d'autres offres. La question principale restant : vont-ils aller seuls sur ce terrain ou vont-ils s'attacher l'expertise d'un spécialiste. Merv Adrian souligne que le partenariat avec Microsoft constitue un « plus » important pour l'éditeur Hortonworks qui réunit une équipe d'experts très spécialisés sur la technologie Apache Hadoop. Cette entreprise, fraîchement émoulue de Yahoo, a pris son indépendance cette année, rappelle l'analyste de Gartner. Sur le marché commercial des systèmes Hadoop, le leader est actuellement Cloudera, cite par ailleurs Merv Adrian. 

Selon l'analyste de Gartner, il est probable que de nombreux clients de Microsoft qui commencent à pense aux Big Data pour la première fois n'auront pas entendu beaucoup parler d'Hortonworks. Voilà qui devrait donner une belle visibilité à cette société. 

De son coté, Stephen O'Grady, analyste chez Red Monk, considère qu'il est important pour Microsoft de disposer d'une solution compétitive pour mettre en oeuvre Hadoop sur sa plateforme. Il est clair que Microsoft estime qu'il est important d'optimiser et d'ajuster sa plateforme dans ce domaine pour se différencier.