Depuis sa version 5.0, la suite décisionnelle de Pentaho permet d'intégrer les données à la source. A partir de son module d'intégration PDI, on peut préparer et croiser des données structurées et non structurées, internes et externes à l'entreprise, pour créer des jeux de données à utiliser immédiatement dans des environnements d'analyse ou de reporting, sans passer par un datawarehouse. « Pentaho concentre sa technologie sur la phase amont, c'est l'une de ses différences », rappelle Emmanuel Brochard, responsable France de l'éditeur depuis un an et demi.

Dans la version 5.2 de la suite qui vient de sortir, l'éditeur de solutions BI en Open Source est allé plus loin dans le traitement des big data avec Streamlined Data Refinery (SDR), présenté comme une raffinerie de données. Celle-ci permet de créer des jeux de données métiers dans le framework Open Source Hadoop. Un utilisateur avancé peut, de façon sécurisée par rapport à son profil, préparer et intégrer des données issues de différentes sources (bases traditionnelles et NoSQL par exemple), en accord avec les standards de gouvernance de l'entreprise. Pentaho a noué des partenariats avec un éditeur comme MongoDB et sur l'ensemble des distributions Hadoop.

Une solution réarchitecturée pour les big data

L'éditeur de solutions Open Source étend d'ailleurs sa présence en Europe (85 personnes) et en France (7 personnes) où Emmanuel Brochard est chargé de développer l'écosystème. L'activité de Pentaho est répartie au niveau mondial entre trois offres : la Business Intelligence (40 à 45% du chiffre d'affaires), l'OEM (30%) et l'analyse des big data (30%), domaine dans lequel la société s'est investie depuis 4 ans, qui progresse fortement (+120%) et pour lequel sa solution a été totalement réarchitecturée. « Les grands comptes se tournent vers notre suite BI pour trouver une alternative économique aux solutions traditionnelles, non seulement pour réduire leurs coûts (entre 75 et 85%) mais aussi pour trouver certaines innovations que des acteurs plus importants n'offrent pas, notamment dans le domaine des big data », estime Emmanuel Brochard.

L'offre OEM, destinée au marché de l'analyse embarquée, est également en plein essor chez l'éditeur (+65% de croissance). Elle vise les éditeurs de logiciels, les fournisseurs de services SaaS et les entreprises qui mettent des portails à disposition de leurs partenaires et qui vont avoir quantités de données à traiter avec la prise en compte des big data. En France, l'équipe de Pentaho gagne de nouveaux clients tous les mois sur ce segment. Parmi eux, une entreprise comme Pixid, spécialisée dans la gestion de l'intérim, l'utilise pour fournir des capacités analytiques à ses clients.