L'éditeur de logiciels décisionnels en Open Source Pentaho a indiqué qu'il prévoyait de livrer une suite décisionnelle complète s'appuyant sur le projet Apache Hadoop. IBM a lui-même confirmé la semaine dernière qu'il préparait un portefeuille de solutions et de services, Infosphere BigInsights, basé sur ce même projet Open Source conçu pour le traitement et l'analyse de très gros volumes de données. Les capacités apportées par Hadoop sont destinées à prendre en charge les flux de données considérables générés par exemple par les transactions bancaires et dans le secteur de l'assurance (avec l'objectif de détecter les fraudes), par les interactions sur Internet (sur les réseaux sociaux notamment) ou encore traités par les centres d'appels.

La suite Pentaho BI va d'abord fournir, pour les processus d'intégration de données, un environnement de conception visuel qui inclura la manipulation de fichiers Apache Hadoop. Cela permettra de concevoir et d'exécuter des processus ETL qui pourront impliquer à la fois des tâches Hadoop et non-Hadoop. A la suite de cette première brique, l'éditeur prévoit de livrer d'autres modules pour effectuer du reporting, des tableaux de bord et des analyses directement sur les données stockées sur un modèle Hadoop.

Pentaho propose aux entreprises intéressées de faire partie de son programme bêta.

Illustration : démo de Pentaho Enterprise intégré avec Hadoop