Editeur d'une suite de Business Intelligence en Open Source pour Windows, Linux et Mac OS X, Pentaho renforce son activité commerciale en France. Cédric Fauvet, responsable du développement de l'offre sur l'Hexagone, rappelle que l'un des objectifs de la suite intégrée, Business Analytics, est de permettre aux utilisateurs métiers de prendre la main sur les données. Il souligne la cohérence entre l'outil d'ETL (extraction, transformation et chargement des données dans une nouvelle base) et les fonctions de restitution de la suite. Dans l'ETL, la vue métier sur les données techniques est alimentée par les développeurs qui disposent de la même vue que les utilisateurs, ce qui permet de comparer avec les résultats obtenus et de mieux prendre en compte les problématiques de qualité des données. « Le but de l'ETL est de mieux servir les utilisateurs de la BI », résume Cédric Fauvet. Sur le marché de l'intégration de données, cette offre se retrouve notamment en concurrence avec celle de Talend (suite d'intégration en Open Source), de l'éditeur français du même nom, indique-t-il.

Pentaho réalise ses ventes en mode direct et indirect. Installé à Orlando, en Floride (où se trouve son siège social), et en Californie, il a noué des accords avec différents partenaires français, parfois de façon mondiale, avec Cap Gemini, Atos, ou encore localement avec Smile et Linalis (pour la partie ETL et restitution), par exemple. Ses fonctions de Business Intelligence sont également diffusées par l'intermédiaire d'accords OEM permettant de les intégrer dans les logiciels d'éditeurs tiers. A cet égard, la version 4.5 de sa suite Business Analytics, tout juste annoncée, fournit une interface pour faciliter l'ajout de visualisations externes, en particulier pour les éditeurs de solutions SaaS (software as a service). 

Kettle versé dans l'Open Source, sous licence Apache

La version 4.5 étend par ailleurs ses fonctions de visualisation de données et d'exploration interactive avec des représentations cartographiques, notamment. Cédric Fauvet signale aussi un environnement plus intégré pour le traitement des big data (*), une problématique prise en compte depuis  2010 par Pentaho. L'éditeur s'appuie sur sa brique ETL pour se raccorder, via un connecteur, à la plateforme Hadoop où s'opèrent les calculs et délivrer ensuite les données où elles doivent être restituées. Ses capacités d'intégration à Apache Hadoop ont récemment été mises en avant par une étude du cabinet Forrester qui rappelle également que l'offre est certifiée pour différentes distributions (Cloudera, MapR, Hortonworks, Amazon et EMC) du framework. En janvier, Pentaho a versé dans l'Open Source sous licence Apache, à partir de sa version 4.3, son moteur ETL Kettle utilisant dans le domaine des big data une approche par les métadonnées.

Outre ses logiciels d'analyse multidimensionnelle (OLAP), de reporting et d'élaboration de tableaux de bord (ces derniers s'adressant à la fois aux développeurs et aux utilisateurs métiers), la suite Business Analytics de Pentaho comprend également un outil de datamining. Ce dernier est destiné aux statisticiens. « Il est prévu à l'avenir d'exécuter les modèles de datamining à l'intérieur du framework Hadoop », indique Cédric Fauvet.

La traduction complète de la suite de BI en français arrivera avec la version 5.0 en septembre 2012. Cette dernière apportera aussi une intégration renforcée entre ses différentes briques. L'effectif global de Pentaho réunit 200 personnes mais l'offre rassemble une communauté de 10 000 personnes dans le monde. 

(*) support étendu des bases NoSQL (création de rapports avec Cassandra, DataStax et MongoDB), utilisation plus simple du concepteur visuel Pentaho MapReduce, support des clusters sécurisés Hadoop...