Le besoin de gérer des volumes sans cesse croissants de données structurées et non structurées contribue à l'adoption du logiciel Open Source Hadoop dans les entreprises. Pour autant, ce dernier ne vient pas remplacer les technologies existantes, mais fonctionne aux côté des bases de données relationnelles. C'est ce que montre une étude de Ventana Research commentée par nos confrères de Computerworld.

Conçu pour traiter des petaoctets de données, Hadoop présente l'intérêt de scinder d'importants jeux de données en plus petits blocs qui sont alors distribués à travers des serveurs en cluster pour en accélérer le traitement. Parmi les tout premiers utilisateurs de la technologie figurent notamment des acteurs du web. Facebook, Amazon, eBay et Yahoo y ont recours pour analyser des petaoctets de données non structurées que la structure des SGBDR traditionnels ne gère pas facilement.

L'enquête menée par Ventana Research auprès de 160 entreprises montre qu'elles sont de plus en plus nombreuses à s'intéresser à Hadoop et à y recourir pour des besoins similaires (54%). La plupart l'utilisent pour collecter et analyser d'énormes quantités de données générées automatiquement (logs, résultats de recherche, contenus de médias sociaux, explique David Menninger, auteur de l'étude. Dans deux tiers des cas, a-t-il constaté, cela porte sur des analyses avancées ou sur des catégories de traitement qu'elles ne faisaient pas avant. La technologie est moins susceptible d'être utilisée pour les analyses conventionnelles portant sur les données transactionnelles et les informations sur les clients, domaines dans lesquels les SGBDR priment toujours.

Néanmoins, en dépit de l'intérêt d'Hadoop, l'étude montre que les entreprises qui l'exploitent rencontrent aussi quelques problèmes, au niveau de la sécurité, du clustering ou du manque de ressources ayant des compétences sur ce logiciel.

Illustration : D.R.