Après Snowflake au début mars, c’est au tour de Databricks de nouer un partenariat et d’investir dans Mistral AI. Sur le premier point, le spécialiste de la gestion de données annonce que les modèles ouverts de la start-up française seront disponibles nativement dans son data store pour entraîner des LLM et construire des IA génératives. Les modèles concernées seront Mistral 7B et 8x7B (et non le dernier LLM Large récemment dévoilé). Ils trouveront également leur place sur la marketplace de Databricks.

Par ailleurs, l’accord prévoit une intégration plus poussée entre Mistral AI et MosaicML. Ce dernier a été racheté par Databricks pour 1,3 milliard de dollars en juin 2023. Il est connu pour ses LLM baptisés MPT. Ces transformeurs existent dans une version comprenant 7 milliards d’hyperparamètres (MPT-7B) et une plus récente avec 30 milliards de paramètres (MPT-30B). Dans le cadre du partenariat, les utilisateurs de Databricks pourront s’appuyer sur plusieurs fonctions de MosaicML pour la diffusion et la gestion des modèles de fondation, mais aussi l’inférence des LLM de Mistral AI (via Mosaic Playground).

Un investissement dans Mistral AI

Second volet du rapprochement entre les deux sociétés, la firme américaine indique avoir pris une participation financière dans la start-up française via son fonds d’investissement Databricks Venture. Le montant n’a pas été communiqué, mais le spécialiste de la gestion de données rejoint ainsi Snowflake qui lui aussi s’est récemment invité au capital de Mistral AI. Sans parler de l'investissement de Microsoft qui a provoqué un débat pour savoir si l'opération de la firme de Redmond n'était pas pour échapper aux sanctions européennes. 

Databricks continue donc ses investissements stratégiques après une levée de fonds de 500 M$ en septembre dernier. En octobre, il avait acquis en octobre dernier pour 100 M$ Arcion, un fournisseur de services de réplication de données d'entreprise en temps réel. Celui-ci est dotée d'un support natif pour plus de 20 bases de données d'entreprise, entrepôts de données et plateformes cloud, incluant MongoDB, Snowflake, AlloyDB, Confluent Cloud, SingleStore, MySQL Amazon Redshift...