En direct de San Francisco - Les tableaux de bord BI se sont multipliés ces dernières années pour explorer et visualiser les données créées dans les entreprises, mais avec l’explosion des big data les sources se sont diversifiées avec des profils éloignés du modèle SQL. Datameer vient répondre à ce besoin d’analyse hétérogène avec une solution cloud supportant Hadoop qui ressemble à un programme de peinture. On commence avec une toile vierge et il suffit d’ajouter des modules (plus de 30 widgets) pour composer un tableau de bord qui répond à ses besoins. Il y a des connecteurs de données pour presque tout (plus de 70), y compris une base de données Oracle, Hadoop, Spark, Twitter et les flux Facebook, Salesforce.com ou Tableau. Même avec cette flexibilité, Datameer génère toujours des visuels particulièrement accrocheurs, qui montrent par exemple comment et où les clients cliquent sur un site, le compte de pages vues et le nombre de visiteurs uniques. Toute l’analyse est faite in-memory avec des fonctions de machine learning pour mieux accompagner les utilisateurs dans la création de modèles.

« Je n’aime pas le mot big data, je préfère data complexity. Le nombre de sources de données est en train d’exploser avec une fin de la frontière entre données structurées et non structurées (sequential vs random access) », nous a précisé Stefan Groschupf, CEO et fondateur de Datameer. Les utilisateurs ont aujourd’hui moins de temps mais la data complexity s’est envolée […] L’analyse de données est née il y a 40 ans avec des sources limitées et statiques récupérées avec une moulinette ETL. Toutes les compagnies ont adopté ce modèle avec des déploiements sur 18 mois. Laquelle peut aujourd’hui encore attendre 18 mois pour installer des outils BI exploitant des données hétérogènes ? »

Des pipelines analytiques multi-étapes et sécurisés

Pour le respect des impératifs réglementaires, Datameer offre des fonctionnalités qui permettent, par exemple, de suivre les lignes de données dans les tableurs. Les fonctionnalités d'audit comprennent des journaux utilisateur-action et permettent de remonter certains événements quand ils se produisent. Des outils de profilage de données aident à tout moment les entreprises à trouver et résoudre des problèmes tels que la corruption des données, à repérer les incohérences ou les données invalides et, ce, dans un pipeline analytique complexe. Les capacités de Datameer comprennent le profilage des données, le suivi statistique, la gestion des métadonnées et l'analyse d'impact. « Nous pouvons aujourd’hui prendre des données brutes, les mettre dans Hadoop pour les nettoyer, avec comme bénéfice de pouvoir de nouveau récupérer les données brutes pour créer un nouveau set de données pour le marketing ou les ventes. Nous ambitionnons d’aider les utilisateurs à faire de bonnes choses avec leurs données », a souligné le CEO.

Datameer affiche également des vues sécurisées et multi-étapes dans ses pipelines analytiques, et il fournit des connecteurs pour une intégration avec LDAP et Active Directory, afin de contrôler les accès et les autorisations aux données. Le support d’Apache Sentry 1.4 est également de la partie avec des fonctions d’anonymisation. Enfin, des règles de rétention flexibles permettent de gérer la politique de conservation de chaque ensemble de données importées. Les règles de sécurité permettent de conserver des données jusqu'à une heure spécifiée, ou de les supprimer manuellement après l'approbation de l'administrateur système.

Une IPO en 2019

Parmi les concurrents, on trouve bien sur les acteurs historiques comme BO (racheté par SAP), Pentaho ou Cognos, mais plus sûrement Tibco Spotfire, QlikView et Tableau Software avec toutefois une zone de confrontation peu étendue, selon le CEO de Datameer.« Ils ne proposent pas de gouvernance des données à ce jour. Le spectre de notre proposition est plus large même si le marché est très compétitif ».

 « Le prix de la solution cloud complète sur Azure est de 50 000 dollars par an (quick start package). Nous facturons au nombre de serveurs et non pas au nombre d’utilisateurs. Une solution plus limitée est proposée à 300 dollars par poste de travail et par an avec les données personnelles (emails, medias sociaux...). Une solution on premise est aussi possible avec une facturation par serveur et par an à 5 000 dollars (comme chez American Express). Plus les serveurs sont nombreux, plus l’analyse est rapide. Nous ne voulons pas facturer chaque service utilisé par les utilisateurs », nous a indiqué le CEO. En plus des États-Unis, Datameer possède des bureaux en Europe, en Allemagne notamment. La start-up qui a levé 76,75 millions de dollars à ce jour - 40 en aout dernier - est à l'équilibre et envisage une IPO en 2019 - soit 10 ans après sa création - nous a précisé Stefan Groschupf. Parmi ses clients, on peut citer Citi Bank, Deutsche Bank, American Express, Visa, Sky, British Telecoms, Thomson Reuters ou encore Kraft.