L'introduction en bourse de Snowflake le 16 septembre dernier a été un événement important, et pas seulement en raison de l'énorme valeur de l’entreprise. En effet, le succès de la plateforme de données d'entreprise basée sur le cloud remet en question une affirmation très assurée faite en 2013 par Mike Olson, le co-fondateur de Cloudera. Á l’époque, ce dernier avait déclaré « qu’aucune infrastructure logicielle dominante au niveau de la plateforme n'avait émergé ces 10 dernières années sous forme de logiciel fermé et propriétaire » et que « cette tendance était aussi surprenante qu’irréversible ». Or Snowflake pourrait y mettre fin. Évidemment, il y a eu Splunk… Mais, comme l'a déclaré Gaurav Gupta, partenaire de Lightspeed, la plateforme a dû batailler fort pour s’imposer avant que l'open source ne trouve ses marques. MySQL, Apache Hadoop, MongoDB, Apache Spark… sont tous (au moins au début) des logiciels libres. Alors que penser aujourd’hui de Snowflake ? La plateforme annonce-t-elle la fin de l'ère de l'infrastructure open source ?

Fermer boutique ?

La réponse à cette question dépend en partie de votre détermination à défendre une telle l'hypothèse. Après tout, ce pas totalement vrai que toute « l'infrastructure logicielle dominante au niveau de la plate-forme » est open source. Il ne s'agit pas forcément de contester l’affirmation de Mike Olson, car il est absolument vrai qu’au cours des 10 à 20 dernières années, la majeure partie de l'infrastructure des entreprises a évolué vers l'open source. Comme le dit Gordon Haff, « on peut certainement trouver beaucoup d’exemples montrant que l'infrastructure est fortement orientée vers l'open source : la plupart des logiciels NoSQL, Hadoop, Kafka, Spark, Ceph, Jupyter, etc. Mais beaucoup de choses dans cet environnement indiquent aussi le contraire : de nombreux services cloud, Tableau, Splunk, etc. Et Snowflake, bien sûr.

Même si ce n’est probablement pas ce que laisse imaginer l’énergique prosélytisme d'antan, les développeurs n’ont jamais fait de l'open source leur religion. On peut facilement expliquer cette tendance « surprenante » par le fait que l'open source a permis aux développeurs de faire leur travail plus facilement grâce à une infrastructure de données open source de haute qualité et facilement accessible. Celle-ci offre, bien sûr, d'autres avantages, notamment l’accompagnement des communautés qui se fédèrent autour des projets, ainsi que la possibilité d’exercer un contrôle plus granulaire sur sa pile logicielle. Mais en fin de compte, l'open source a gagné parce qu'il permet aux développeurs « de faire avancer les choses ». C'est pour cela que l’on trouvera toujours des développeurs contents d'utiliser des logiciels open source comme Apache Airflow pour charger des données dans leur plate-forme de données propriétaire Snowflake. Ce n'est pas de la dissonance cognitive. C'est du pragmatisme.

Le passage aux services gérés

En parlant de pragmatisme, Tom Barber suggère que le passage aux services gérés dans le cloud entame quelque peu « l'intérêt des gens pour l'open source… parce qu'avec le SaaS, ils ne paient pas pour des licences mais pour un service, ce qui change un peu la manière de penser ». Après tout, « l'open source signifie que l’on ne paye pas pour les licences, mais que l’on doit quand même payer quelqu'un en interne ou en externe pour installer, régler, exécuter le logiciel… », poursuit-il. « La plupart des gens peuvent installer MySQL avec apt ou yum, mais le réglage lui-même nécessite des connaissances approfondies ». Ou, pour le dire autrement comme le fait James Governor, analyste de Redmonk, « le cloud offre un bien meilleur mécanisme de distribution et d'empaquetage que l'open source… La commodité est vraiment une killer app, et les services gérés gagnent sur ce plan ».

Et si, comme le suggère Mike Olson lui-même, « les logiciels libres offrent toujours un avantage stratégique », « la fin des frictions » n'est plus un facteur de différenciation comme cela semblait être le cas il y a dix ans. Les experts du cloud ont retenu cette leçon : les infrastructures propriétaires dans le cloud sont très faciles à acquérir et à utiliser. Cela ne veut pas dire que l'open source n'est pas pertinent. Loin de là. « L'open source n'est pas un modèle économique, mais c'est un excellent moyen de créer des logiciels, d'établir la confiance et de nourrir la communauté », poursuit M. Governor. Cette « excellente façon de construire des logiciels » s'applique également aux fournisseurs de SaaS comme Snowflake. Même si, comme le rappelle Gordon Haff, « des services comme Snowflake ne sont pas open source, ils utilisent activement l'open source sous le capot ». Par exemple, l'open source FoundationDB est « un élément clé de l’architecture Snowflake, car il a permis de construire des fonctionnalités vraiment étonnantes et différenciatrices ». En 2019, une étude de Whitesource avait montré que 99 % des logiciels reposaient sur du code open source. Á cet égard, Snowflake n'est pas exceptionnel. L'open source, en somme, a toujours de l'importance. Beaucoup d’importance.

L'open source sous le capot

Mais pour les acheteurs potentiels de services comme Snowflake, l'open source n'est peut-être pas ce qui les attire le plus. Comme l'affirme Ken Horn, « dans le cas d’un service comme Snowflake, ce sont les données, et non le code source, qui doivent primer ». Et si « une fois dans le cloud, toute l’affaire autour des logiciels open source suscite à peine un haussement d’épaules », ce n’est certainement pas le cas de Snowflake et d'autres fournisseurs qui pourraient décider de délivrer des services d'entreposage de données et d'autres services de ce type. Car l'open source leur offre la possibilité de s'appuyer sur un riche écosystème de blocs de construction. Mais les acheteurs potentiels veulent juste exécuter leurs tâches, autrement dit qu'ils ne veulent pas faire le travail de base associé parfois à l'open source. Alors, l’affirmation faite en 2013 par Mike Olson est-elle erronée ? Non, mais on peut sans doute la formuler autrement : « Aucune infrastructure logicielle dominante au niveau de la plate-forme n'a émergé au cours des 10 à 20 dernières années sous une forme propriétaire et fermée qui ne repose sur une licence open source ou qui ne dépende fortement de logiciels open source ».