EMC Isilon a présenté une baie de stockage NAS évolutive qui intègre nativement Hadoop, outil Open Source d'analyse des grands volumes de données. Selon EMC, la diffusion de Hadoop dans l'entreprise a été freinée par le fait que les précurseurs n'ont eu d'autres choix que de s'appuyer sur des infrastructures de stockage inadaptées et pas optimisées pour le traitement des Big Data. Notamment, elles écartaient le partage des données, une fonction capitale pour l'exploration des gros volumes d'informations. L'intégration du protocole HDFS (Hadoop Distributed File System) avec la solution de stockage NAS d'EMC Isilon « élimine les problèmes d'intégration des divers composants Open Source avec le matériel. » Cela signifie que les clients peuvent désormais profiter des avantages de fonctionnalités analytiques des Big Data sans avoir besoin de chercher à adapter et à intégrer des produits issus de multiples fournisseurs. « L'intégration du HDFS supprime également le seul point d'achoppement inhérent à la plate-forme Open Source Hadoop Apache traditionnelle », a indiqué EMC.

La firme prévoit de combiner son offre NAS Isilon avec son propre système d'analyse Open Source Greenplum HD. Elle pense que cette solution aidera également à réduire la complexité des déploiements Hadoop. « La solution Isilon permet aux clients de relier Hadoop et ses fonctionnalités intégrées directement à un flux d'analyse de données structurées, sans avoir besoin de déplacer les données », a expliqué Luke Lonergan, CTO de Greenplum. « Cette combinaison améliore la collaboration et accélère l'analyse des données. Nos clients peuvent ainsi mettre en évidence certains résultats plus rapidement. Ils sont donc plus efficaces et disposent d'un avantage sur leurs concurrents. » EMC affirme que Isilon est la seule plate-forme de stockage NAS à intégrer le protocole HDFS en natif. Celui-ci est compatible avec de nombreux protocoles standards de l'industrie (NFS, CIFS, FTP, HTTP) et permet à l'entreprise d'avoir la main sur la protection, le stockage et le déplacement rapide des données.

Evangéliser autour d'Hadoop au sein des entreprises

Conçu à l'origine pour aider les projets de recherche à grande échelle, Hadoop trouve de plus en plus sa place au sein des entreprises. En particulier quand la quantité de données à traiter dépasse la capacité des bases de données relationnelles classiques. Mais aussi quand une entreprise recueille de grosses quantités de données sans savoir encore quel type d'analyses elle doit leur appliquer pour en tirer des résultats. JPMorgan Chase utilise cette technologie pour la détection des fraudes et la gestion des risques. De son côté, eBay y recourt pour construire un nouveau moteur de recherche pour son service d'enchères.

Fonctionnelle depuis six ans, la plate-forme Hadoop n'est disponible en version 1.0 que depuis fin 2011. Cependant, la technologie bénéficie déjà de nombreux soutiens sur le plan commercial. Des startups comme Cloudera, Hortonworks - une émanation de Yahoo ! - et MapR proposent toutes des distributions commerciales du logiciel. IBM a intégré Hadoop dans son pack d'analyse de données InfoSphere BigInsights et Microsoft fait tourner une copie de Hadoop sur son service cloud Windows Azure. « Dès que les entreprises seront convaincues que l'adoption de Hadoop pourra simplifier leur infrastructure et leur architecture et qu'elle leur permettra de gérer et partager leurs données en toute sécurité, la plate-forme Open Source va changer la donne dans le secteur de l'analyse des données non structurées », a déclaré Sam Grocott, vice-président du marketing chez EMC Isilon. « Nous pensons que cette solution, qui associe les capacités des systèmes en scale-out NAS Isilon avec l'écosystème Hadoop en offrant des fonctions d'analyse des données sur une plate-forme de stockage, va accélérer le déploiement d'Hadoop à l'échelle de l'entreprise. »