Tableau Software se prépare pour l’acte 3 de son odyssée. Dans la logique de Christian Chabot, co-fondateur de la société avec Chris Stolte et Pat Hanrahan il y a 13 ans, l’acte 3 démarre lorsqu’un éditeur de logiciels ayant rencontré le succès atteint le milliard de dollars de chiffre d’affaires, ainsi qu’il l’a expliqué cet été à GeekWire. Or, ce spécialiste de l’analyse et de la visualisation de données devrait franchir cette année le cap des 800 millions de dollars, si l’on se fie à ses dernières estimations pour le 4e trimestre 2016. Situées entre 225 et 235 M$, elles s’ajouteront aux 576 M$ engrangés depuis janvier.

Tableau s’apprête donc à se développer à une autre échelle - graduée en milliards de dollars - qui « n’a jamais été approchée par une entreprise uniquement centrée sur l’analytique », nous a indiqué la semaine dernière Edouard Beaucourt, directeur France et Europe du Sud de Tableau, lors d’un point presse à Paris (pour mémoire, Business Objects avait réalisé un CA de 1,5 Md$ l’année de son rachat par SAP en 2007). Avec en ligne de mire cette stratégie de croissance, Andrew Beers, directeur du développement de l’éditeur basé à Seattle, a fait le tour des filiales européennes pour présenter la feuille de route de la plateforme analytique, sur les trois prochaines années. Il l’a déclinée en quatre parties. 

HyPer, une base in-memory qui traite les analyses spatiales

La première concerne les bases de données. Tableau a racheté en mars une start-up, HyPer, issue d’un projet de recherche de l’Université technique de Munich. Pour Andrew Beers, elle fait partie de la poignée d’acteurs qui ont une technologie de base de données « réellement fantastique », apprécie-t-il. « Rapide sur les requêtes, sur le chargement et ce n’est pas juste une database pour les requêtes analytiques, qu’elle fait très bien ». HyPer a été conçue pour traiter simultanément en mémoire les requêtes OLAP et OLTP et il y a une 3ème partie qui va au-delà du relationnel et permet des analyses spatiales ou statistiques, rappelle Andrew Beers.

Tableau a donc prévu d’intégrer la technologie d’HyPer dans son moteur d’extraction. « La façon dont elle sera packagée reste encore à déterminer mais cela deviendra notre moteur d’extraction et de notre plateforme d’intégration ». Pour le directeur du développement, ce moteur va constituer un pas de géant pour accélérer et enrichir l’expérience des utilisateurs avec les données. Il sera toujours possible de se connecter en direct à une cinquantaine de sources différentes dont Amazon Redshift, Google BigQuery et Microsoft SQL Server. Hyper va être déployé sur Tableau Public et Tableau Online avec une version bêta début 2017. 

Projet Maestro, une approche visuelle pour préparer les données

La deuxième partie de la feuille de route concerne le projet Maestro annoncé sur la conférence utilisateurs de novembre (à Austin, Texas). Avec cette étape, Tableau veut prendre pied dans le nettoyage et la préparation de données, le data wrangling, qui constitue l’une des opérations préalables les plus fastidieuses, chronophages et délicates dans les projets d’analyse de données. Elle nécessite de bien connaître la nature des informations que l’on manipule, ce qui limite le nombre de personnes capables de s’en occuper avec efficacité. Avec Maestro, l’objectif est de faciliter ce processus en proposant une approche visuelle et directe, afin de pouvoir mettre dans la boucle d’autres utilisateurs, IT ou métiers.

La visualisation fera apparaître les jointures, les rapprochements et les calculs effectués. Maestro s’intègrera à la plateforme Tableau pour une publication des données sur Tableau Online ou Server ou pour une analyse sur la version desktop. Pour autant, l’arrivée de cette brique ne remettra pas en question les partenariats établis avec les fournisseurs spécialistes de l’intégration de données, nous a précisé Andrew Beers. L'éditeur américain travaille avec les principaux spécialistes de l'ETL. En France, la start-up française Dataïku complète également son offre.

Avec le projet Maestro, davantage d'utilisateurs pourraient intervenir sur le nettoyage des données, selon l'éditeur.

Linux au 2e semestre 2017, langage naturel et machine learning

Le troisième point abordé par le directeur du développement, c’est la version Linux annoncée il y a plusieurs mois déjà et dont la bêta arrivera l’an prochain. Aujourd’hui, on peut installer le logiciel sur site sous Windows, l'utiliser sur desktop, y accéder en SaaS ou le déployer sur AWS (Tableau est dirigé depuis août par Adam Selipsky, ancien COO d'AWS), sans oublier la version gratuite en ligne Tableau Public. A partir du 2ème semestre 2017, on pourra également l’installer sur les grandes distributions de l’OS Open Source, promet l’éditeur. « Linux est mieux supporté que Windows et certaines entreprises nous ont dit de revenir les voir lorsque nous aurions cette version, par ailleurs certains de nos clients le préfèrent et d’autres en ont besoin pour leurs propres clients », a énuméré Andrew Beers lors du point presse. Dans un billet, François Ajenstat, chief product officer de l’éditeur américain, enfonce le cloud. L’OS est « moins cher, plus personnalisable » et offre une façon plus sécurisée d’exploiter Tableau dans le cloud. Pour migrer, il suffira de « faire un back-up de l’actuel Tableau Server sous Windows et de le restaurer vers Linux », assure-t-il en précisant que des outils comme Yum et Apt seront intégrés avec le logiciel.  

L’enrichissement des fonctions analytiques constitue le quatrième axe d’évolution de Tableau. Sur ce terrain, Andrew Beers a évoqué les requêtes en langage naturel et l’introduction de recommandations « de type Netflix ». Des algorithmes de machine learning étendront les capacités de « découverte de données » en recommandant l’utilisation de certaines visualisations, classeurs (en anglais workbooks, regroupés dans une bibliothèque) ou bien sources d'informations qui permettront d’appréhender les données sous de nouvelles perspectives.

Une forte communautés d'utilisateurs

Au cours des années, Tableau est parvenu à bâtir une communauté d’utilisateurs autour de son produit, y compris dans l’Hexagone, nous a indiqué Edouard Beaucourt. « C’est un fort différentiateur sur le marché, cette idée de communauté ouverte avec de nombreux users groups qui cherchent à tirer davantage de sens de leurs données », assure le dirigeant français qui insiste notamment sur le succès de Tableau Public, plateforme ouverte que les blogueurs, les étudiants et les médias peuvent utiliser pour réaliser des infographies parlantes. En consultant les analyses librement accessibles faites avec Tableau Public, des entreprises peuvent s’apercevoir qu’il y a des aspects de leurs métiers qui pourraient tirer profit de certaines façons de représenter les données, nous a exposé Andrew Beers. L’outil est gratuit tant que les graphiques sont publiés de façon publique et ouverte. Et il n’est pas question de monétiser le produit d’une quelconque façon, assure Edouard Beaucourt. Toutefois, cette version trouve ses limites dès lors que les visualisations doivent être partagées dans un cadre privé et sécurisé. Dans ces cas-là, il faut passer à une version payante du logiciel. Par sa gratuité, Tableau Public est un outil de promotion très important pour l’éditeur, reconnait le dirigeant français. 

Alertes, accès aux données en mode hybride, tunnel sécurisé

Sur sa roadmap produit, l’éditeur de Seattle prévoit également l’ajout d’alertes déclenchées par des seuils de données déterminés par l’utilisateur. Lors de son passage à Paris, le responsable du développement a également abordé la nécessité de pouvoir se connecter aux données sur un mode hybride, qu’elles se trouvent dans le cloud ou sur site, derrière le firewall. Un nouvel agent de requête permet ainsi d’ouvrir un tunnel sécurisé pour accéder à des données on-premise depuis Tableau Online. Enfin, parmi les ajouts figurent aussi des tableaux de bord pré-construits pour des applications externes fréquemment utilisées, comme Salesforce ou Marketo, une fonctionnalité de superposition de données sur une même carte.

En cours de développement chez Tableau Software, une fonctionnalité permettra de superposer différents jeux de données sur une carte. (crédit : D.R.)

Près de 50 000 entreprises recourent déjà à Tableau dans le monde, dont 9 000 en Europe, de la plus petite à la plus grande, nous a redit Edouard Beaucourt en précisant qu’il y avait parmi elles beaucoup de start-ups, mais aussi des banques telle BNP Paribas et des industriels comme Peugeot Citroën. Certaines sociétés, comme le cabinet de conseil Mydral, spécialisé dans la compréhension des données, s’appuie fortement sur ses outils pour leurs propres activités. Dans les grands comptes, l’éditeur s’introduit souvent dans un premier département, établit la preuve d’un fort retour sur investissement avant d’étendre son usage à d’autres utilisateurs, nous a exposé le dirigeant français en citant sur ce terrain le cas de La Poste. De fait, le spécialiste du courrier avait témoigné en ce sens sur la conférence parisienne de Tableau en mai dernier. Il a aujourd’hui déployé des milliers d’utilisateurs dans 3 ou 4 de ses principales entités.