Avant de rejoindre MemSQL en 2019, devenu SingleStore en 2020, vous avez passé plusieurs années chez Tibco, et fait également un rapide passage chez HortonWorks, des éditeurs de logiciels d’infrastructure. Qu’est-ce qui vous plaît dans ce domaine et pourquoi avez-vous décidé d’aller chez SingleStore ?

J’ai fait ma carrière au cœur des technologies d’infrastructure. Ce que j’apprécie dans ce domaine, c’est que l’infrastructure permet de travailler avec tous les secteurs d’activité et tous les pays, chaque projet est très différent. C’est moins le cas avec des applications très métiers, comme des logiciels pour les ressources humaines.

Dans l’infrastructure, si la technologie n’est pas assez bonne, cela s’arrête assez vite. Les acheteurs sont souvent plus experts que nos ingénieurs, aussi il est essentiel de discuter avec les clients. C’était mon objectif en rejoignant SingleStore. Nous comptons parmi nos clients de grandes banques, certaines des plus grandes compagnies de télécoms, qui nous disaient « nous ne pouvons faire ce que nous faisons avec MemSQL avec aucune autre base de données ». Cela m’a rendu confiant : si la technologie était là, il était possible de bâtir une entreprise solide. La technologie est notre principal actif.

Vous observez le marché des bases de données depuis plusieurs années. Comment l’avez-vous vu évoluer et comment le percevez-vous aujourd’hui ? Quels sont les grands enjeux actuels selon vous ?

Cela fait presque 25 ans que je travaille autour des données. Jusqu’à 2018 environ, les données restaient relativement gérables et compréhensibles, elles étaient principalement gérées dans des bases SQL comme Sybase, Informix ou DB2, avec des ensembles de données bien structurés. Puis sont arrivés les smartphones, les réseaux sociaux, et la vélocité des données a explosé.

Il a fallu trouver de nouvelles façons de gérer les données, car les bases traditionnelles n’étaient pas conçues pour ces nouveaux formats. Elles ne peuvent pas faire du scale-up (mise à l’échelle verticale), seulement du scale-out (mise à l’échelle horizontale), ce qui est vite coûteux, car il faut ajouter de nouvelles bases de données. Des bases spécialisées se sont développées pour différents usages, par exemple des bases orientées documents, et dans les entreprises le nombre de bases a considérablement augmenté. Certaines sont passées d’une seule base de données à plus d’une quarantaine, multipliant d’autant les points de défaillance uniques. Cela a également entraîné des problèmes liés aux mouvements de données d’une base à l’autre, qui augmentent d’autant les délais de traitement des requêtes. Dans de telles architectures, il n’est pas possible d’avoir une faible latence, alors même que les attentes des clients se portent de plus en plus vers le temps réel.

Qu’est-ce ce que cette demande de temps réel signifie pour les bases de données ?

Pour le vrai temps réel, les bases de données doivent répondre en quelques secondes, voire millisecondes. Deux facteurs permettent aux bases de données d’être plus rapides : d’une part, faire plus de choses dans une même base ; d’autre part, optimiser l’architecture de stockage dans son ensemble. SingleStore a une architecture de stockage à trois niveaux (mémoire, SSD local et stockage objet, local ou dans le cloud), qui permet de séparer le traitement des données et le stockage. Cela nous permet d’aller jusqu’à dix fois plus vite que certaines solutions concurrentes, mais également d’offrir un meilleur coût total de possession (TCO).

L’une des caractéristiques de SingleStore est de cibler à la fois les applications transactionnelles et analytiques. Sur ces dernières, qu’est-ce qui a changé ?

La pandémie a accéléré les changements d’usage, notamment sur l’analytique. Les utilisateurs voulaient des données les plus fraîches possibles pour prendre des décisions. Pour rafraîchir un rapport d’activité standard, il faut entre 40 et 60 requêtes. La performance de la base de données a un impact immédiat : si chaque requête prend quelques secondes de plus, à la fin l’utilisateur attend plusieurs minutes supplémentaires. Par exemple, aujourd’hui je suis à Paris, demain je serai en Suisse. Le temps que les données transactionnelles soient remontées et analysées par la compagnie aérienne, les offres qu’elle m’enverra pour Paris ne seront plus pertinentes. C’est pour répondre à cet enjeu que nous avons réuni les applications transactionnelles et analytiques en une seule plate-forme.

Pour aller plus loin encore, nous avons ajouté une fonctionnalité dénommée Workspaces, officiellement lancée le 22 juin. Grâce à celle-ci, les ressources de calcul sur une base de données peuvent être subdivisées afin d’exécuter plusieurs charges de travail simultanément, dans des espaces séparés. Cela permet d’exécuter des traitements analytiques directement sur la base, sans avoir à déplacer les données au préalable.

Une autre fonctionnalité importante ajoutée sur la plate-forme est l’intégration d’un module Wasm. Pouvez-vous nous expliquer ce que celui-ci apporte ?

L’autre nouveauté qui me semble particulièrement intéressante est le code engine, qui permet de porter du code existant sur notre plate-forme en générant du code intermédiaire WebAssembly (Wasm). De cette façon, les entreprises peuvent facilement déployer leurs modèles analytiques ou d’IA sur SingleStore. À cause du phénomène de gravité des données, mieux vaut amener les modèles analytiques là où sont les données, plutôt que de déplacer les données vers le modèle.

Aujourd’hui, on évoque souvent les bases de données NoSQL comme alternative aux bases transactionnelles classiques. Quel est votre point de vue sur ce marché ?

Le marché des bases de données NoSQL est très riche à l’heure actuelle, il y a probablement plus d’une centaine de fournisseurs de solutions. Mais en un sens, cette profusion montre aussi que cela répond à un besoin dans les entreprises. Le marché des bases de données est estimé à plusieurs centaines de milliards de dollars. Pourtant, si l’on regarde le chiffre d’affaires cumulé des principaux acteurs NoSQL, il atteint à peine 5 milliards en 2021. Selon moi, c’est parce que nous en sommes encore aux débuts. Il existe encore beaucoup de bases de données historiques qui vont être libérées. Le marché est suffisamment grand pour répondre aux besoins. D’ici 5 à 7 ans, nous allons sans doute voir des acteurs faisant autour de 20 milliards de chiffre d’affaires sur le marché des bases de données.

Comment SingleStore se positionne-t-il par rapport aux bases de données NoSQL ?

Dans le NoSQL, il n’y a pas besoin de schéma, on peut démarrer plus vite. Cela permet d’avoir des interfaces utilisateurs très rapides sur les applications transactionnelles, avec une très haute résilience et une haute disponibilité fantastique. En revanche, ce n’est pas très efficace sur les applications analytiques. Des acteurs comme MongoDB disent « gérer vos données, c’est gérer vos documents ». Nous disons plutôt « vos données sont davantage que des documents. » Avec SingleStore, on peut gérer des documents, des données IoT, des séries chronologiques, faire des index, partager des données en SQL, avec des relations entre data types qui permettent des usages analytiques. Nous faisons du SQL distribué pour avoir une plus grande résilience encore que les fournisseurs de NoSQL, avec une base de données très simple d’utilisation.

Fabio Pulidori : sur le moyen et le long terme, les entreprises vont consolider leurs bases de données. Nous voulons être la base de données qui restera quand celles-ci se compteront sur les doigts d’une main.

Et comment vous positionnez-vous par rapport à des acteurs comme Snowflake ?

Snowflake est une espèce intéressante. Ils viennent d’annoncer Unistore. Avant, ils se présentaient plutôt comme une plate-forme pour l’échange de données, davantage qu’une base de données. Mais dans leur modèle, la facturation s’effectue à la requête, ce qui peut entraîner des surprises sur les coûts si on n’y prend pas garde. Ils travaillent en minutes, nous travaillons en millisecondes. Nous avons été récemment comparés à eux, ainsi qu’Amazon Redshift dans un benchmark réalisé par GigaOm.

Il s’agit de deux bases de données dans le cloud. Est-ce l’avenir du stockage de données ?

95% des dépenses sur les bases de données vont aller sur le cloud. Les critères de choix seront le temps réel, la flexibilité, le multicloud et le multi-modèle. Notre solution est disponible en mode autogéré, dans les clouds AWS, Google Cloud Platform, Microsoft Azure, ainsi qu’on-premise, sur un cloud privé ou Red Hat OpenShift.

Vos deux dernières levées de fonds, en décembre 2020 et septembre 2021, vous ont permis de réunir chacune 80 millions de dollars. Où en êtes-vous aujourd’hui ?

Nous venons de réaliser une nouvelle levée de fond de série F, d’un montant de 116 millions de dollars, auprès de Goldman Sachs, qui est également l’un de nos clients. Parmi nos investisseurs nous comptons Hewlett Packard Enterprise (HPE), Dell, IBM ou encore Google.

Quels sont vos axes de développement pour les années qui viennent ?

Nous allons continuer d’investir dans notre produit pour nous assurer qu’il reste très robuste. Nous allons aussi renforcer notre expansion à l’international, notamment en Europe, avec un focus sur quatre pays : la France, l’Allemagne, le Royaume-Uni et les Pays-Bas. La France en particulier est un pays qui innove beaucoup sur les usages des données. Enfin, nous voulons mieux faire connaître SingleStore. Nous avions l’habitude de dire que nous étions le secret le mieux gardé du marché des bases de données, nous voulons aujourd’hui nous rendre visibles.

Fabio Pulidori : nous sommes déjà bien implantés aux États-Unis, avec de grandes références comme Goldman Sachs. En Europe notre présence est plus récente, mais nous avons déjà réussi à avoir une vingtaine de références, parmi lesquelles une grande banque française qui a choisi notre solution pour remplacer une base SQL sur l’analyse de risques.

Parmi vos clients figurent des acteurs comme Uber, mais aussi beaucoup de banques et de grands opérateurs tels Comcast. Certains secteurs ou profils d’entreprises sont-ils davantage représentés dans vos clients ?

Nous avons beaucoup de clients dans la banque et les télécoms, car ce sont des secteurs particulièrement innovants, avec des besoins importants sur le temps réel, pas seulement pour leurs clients, mais aussi sur la conformité par exemple. Les MarTech et AdTech (technologies marketing et publicitaires), ainsi que les médias s’orientent eux aussi massivement vers le temps réel. Parmi nos clients français, nous comptons par exemple la plate-forme d’automatisation marketing Captain Metrics,

Chez certains clients, nous avons remplacé les technologies Oracle et Microsoft. (NDLR C’est le cas par exemple chez Siemens.) Mais c’est souvent plus compliqué dans les grandes entreprises. Elles osent moins innover sur les bases de données, car elles ont le sentiment d’avoir trop à perdre.

SingleStore a noué de nombreux partenariats technologiques avec de grands acteurs (NDLR Le dernier en date est avec Intel, autour d’une solution optimisée pour le traitement de données en temps réel). Quelle place tiennent ces partenariats dans votre stratégie ?

Notre écosystème est très important. Nos investisseurs sont souvent aussi nos partenaires technologiques : IBM, HPE, Dell embarquent nos technologies. SAS est également un partenaire important, qui utilise SingleStore pour le stockage des données dans sa plate-forme analytique et IA Viya. Ainsi, celle-ci va beaucoup gagner en rapidité et SAS vient concurrencer des acteurs comme Databricks et Snowflake