La gestion du contrôle d'accès aux données en environnement Hadoop est souvent considérée comme un défi. Dans ce domaine, l'éditeur californien Zettaset va ajouter une couche de sécurité à sa plateforme Hadoop Orchestrator qui fonctionne avec les principales distributions Hadoop. Ces outils permettront  aux administrateurs IT d'installer un contrôle d'accès basé sur des rôles. Il sera ainsi possible de définir plus précisément ce que chaque catégorie d'utilisateurs peut ou ne peut pas faire avec les données sur la plateforme. Cela donnera en particulier les moyens d'empêcher l'exécution de certaines tâches, de même que l'importation et l'exportation de certains types de données.

Avec SHadoop, les administrateurs pourront définir une politique de sécurité pour l'ensemble des utilisateurs accédant au système Hadoop, utilisateurs dont ils pourront suivre l'activité. De prochaines versions de ces outils permettront de chiffrer les données stockées dans un cluster Hadoop ou transmises entre deux noeuds, promet Zettaset. Un nombre croissant d'entreprises ont commencé à utiliser le système de gestion de fichiers distribués d'Apache Hadoop pour stocker et de gérer des données provenant de sources disparates (réseaux sociaux, e-mails, fichiers vidéo, capteurs, etc.) beaucoup plus efficacement qu'avec une base de données relationnelle. Cette technologie est adaptée à l'analyse des énormes volumes d'information ainsi récupérés (chiffrés en petaoctets). Mais sa mise en oeuvre génère aussi de nouveaux problèmes de contrôle d'accès. 

Les analystes soulignent le besoin de sécurité

Contrairement aux bases de données traditionnelles, Hadoop ne donne pas beaucoup de moyens au-delà des listes de contrôles d'accès (ACL, Access Control Lists) et de l'authentification basée sur le protocole Kerberos. Authentifier les utilisateurs ne suffit pas. Il faut pouvoir attribuer plus finement les autorisations d'accès, souligne David Menninger, analyste de Ventana Research. « Vous pouvez séparer les données sensibles en différents fichiers, noeuds et clusters, mais cela ne vous donne toujours pas le niveau de contrôle auquel on est habitué avec les bases relationnelles ». De fait, la sécurité reste l'une des faiblesses pointées par les entreprises intéressées par Hadoop. Dans une étude de Ventana Research publiée l'an dernier, moins de la moitié des personnes interrogées se sont déclarées satisfaites des capacités de sécurité et de chiffrement d'Hadoop, contre 70% pour ceux recourant à d'autres technologies de bases de données.

Nathaniel Rowe, analyste d'Aberdeen Group, pense lui aussi que les fonctions de sécurité des distributions Hadoop actuellement disponibles ne correspondent pas suffisamment aux besoins des entreprises. « C'est une plateforme qui se développe extrêmement rapidement, l'engouement est incroyable, mais sur le terrain de la sécurité, elle n'est pas toujours à la hauteur », reconnaît-il.

Zettaset présentera sa couche SHadoop à la prochaine conférence RSA qui se tiendra à San Francisco du 27 février au 2 mars 2012.