Il y a un an, alors qu’il passait dans le giron de deux fonds d’investissement, l’éditeur américain Cloudera rachetait dans le même temps Datacoral et Cazena. Avec ces acquisitions, l’objectif annoncé était d'ajouter du self-service en SaaS à ses solutions hybrides de gestion des données. C’est chose faite avec CDP One, une offre SaaS de data lakehouse qui réunit des outils d’apprentissage machine et d’analyse de données. Ces fonctionnalités s’appuient notamment sur la plateforme acquise avec Cazena.

Cloudera reprend ici le concept de lakehouse popularisé par Databricks qui associe les avantages des data lakes et des data warehouses (le stockage à coût réduit du datalake, les capacités du datawarehouse pour explorer les données). L’éditeur de Palo Alto décrit CDP One comme une offre sécurisée administrée qui permettra aux entreprises de réduire leurs temps de mise en oeuvre, en particulier lorsque leurs ressources IT ne sont pas extensibles (une situation assez généralisée compte-tenu des difficultés actuelles de recrutement).

Des pipelines analytiques de bout en bout

Dans un billet, Ram Venkatesh, CTO de Cloudera, la présente comme « la 1ère offre SaaS de data lakehouse apportant des services cloud de compute, de stockage, d’apprentissage machine, d’analyse de flux de données [streaming analytics] avec des fonctions de sécurité intégrées ». Ces dernières sont granulaires, basées sur des rôles d'utilisateur, avec une authentification reposant sur Kerberos et un chiffrement fort. S'y ajoutent des fonctions d'audit, de lignage de données et de gouvernance couvrant l'ensemble de la plateforme. Cette offre Zero Ops est bâtie sur la technologie de Cloudera et, selon ce dernier, réduit le coût total de possession d’une telle plateforme de 20% à 35% (mise en route initiale et tâches opérationnelles incluses) lorsqu’on la compare aux offres qu’il faut bâtir soi-même. Dans son billet, Ram Venkatesh présente l'ensemble des fonctionnalités disponibles sur CDP One. Il explique que les spécialistes des données pourront produire des pipelines analytiques de bout en bout : ingestion des données, conservation sécurisée, préparation pour différents traitements analytiques, en utilisant de multiples langages, de SQL à Python en passant par R.

Avec CDP One, Cloudera entend s'adresser à un large éventail d’utilisateurs, développeurs, data scientists et autres experts de la data mais également ceux qui se lancent dans la gestion de données, de plus en plus nombreux au fur et à mesure que se généralisent les outils de développement low-code. Le fournisseur met en avant la réduction des temps de déploiement. Il cite l’un des premiers utilisateurs de l’offre en self-service, le groupe de gestion de voyages d’affaires CWT, qui a pu commencer à migrer ses données dans le cloud en deux jours et mettre en production ses premiers cas d’usage en un mois sans avoir à mobiliser des ressources IT supplémentaires. Parmi les partenaires associés au lancement de CDP One figure le spécialiste français de l’intégration de données Talend. 

L'offre est disponible pour les entreprises pré-inscrites. Sa disponibilité générale interviendra plus tard. Sur ce marché des plateformes de données intégrées, Cloudera concurrence des spécialistes de premier plan comme Databricks et Snowflake, mais aussi Microsoft et Dremio.