Mistral a-t-il déjà perdu ou compris où se repositionner ?

Nettement distancé dans la course aux LLM - et encore plus depuis la sortie de Claude Mythos - Mistral pourrait bien trouver son marché en proposant une surcouche IA facilitant l'intégration des modèles sans dépendre d'OpenAI, Anthropic ou Google.

Ces dernières années, le segment le plus visible du marché de l’IA a été facile à caricaturer : OpenAI attire l’attention des consommateurs, Anthropic séduit les développeurs, Google bénéficie du doute grâce à des modèles de plus en plus performants et à une gamme de produits complémentaires, tandis que tous les autres doivent expliquer pourquoi ils ne sont pas encore morts. C’est injuste, bien sûr, mais pas tout à fait faux. Dans le domaine de l’IA, l’attention se cumule et génère des revenus colossaux : OpenAI et Anthropic se précipiteraient toutes deux vers des introductions en bourse d’une valeur de plusieurs milliards de dollars, portées par des milliards de chiffre d’affaires. Il est donc facile de pointer que Mistral AI est largement distancé, surtout depuis la sortie de Claude Mythos..

Honnêtement, je n’avais pas pensé à cette entreprise parisienne depuis un an. Peut-être même plus longtemps. Mais Brian Hall a annoncé qu’il rejoignait Mistral en tant que directeur marketing, et j’ai eu un moment « Her ? » à la Arrested Development. Biran Hall, un cadre de longue date chez Microsoft, m’avait embauché chez AWS avant de diriger le marketing produit chez Google Cloud. Son arrivée a suscité de la curiosité, car Mistral ne domine pas les discussions des développeurs aux États-Unis et ne dispose pas des mêmes budgets informatiques apparemment illimités qu’Anthropic ou OpenAI. Si le marché de l’IA n’était qu’une course à la création du modèle le plus gigantesque, le plus magique et le plus polyvalent, Mistral ne serait pas l’entreprise sur laquelle parier.

Pas la bonne question et probablement pas le bon pari

La question la plus intéressante est de savoir quand le marché de l’IA d’entreprise reviendra à la normale et exigera que l’IA offre la même sécurité, la même prévisibilité et le même contrôle que ceux auxquels nous sommes habitués avec d’autres investissements informatiques. C’est là que Mistral a un véritable atout. Comme le note Brian Hall, l’approche de Mistral consiste à « donner la priorité à l’IA pour les environnements critiques qui ont besoin de la confiance et de l’autonomie nécessaires pour s’engager sur le long terme (avec des modèles ouverts et de véritables capacités souveraines) ».

Si cela pouvait sembler être un argument de vente trop optimiste, cela s’est concrétisé en juin lorsque le gouvernement américain a ordonné à Anthropic de suspendre l’accès des ressortissants étrangers à ses modèles les plus avancés, Fable 5 et Mythos 5. Anthropic a déclaré qu’elle désactiverait ces modèles pour tous les utilisateurs en raison de la directive sur le contrôle des exportations. « Ce fournisseur peut-il être contraint de nous couper l’accès ? » n’est plus une question théorique. C’est pourquoi l’accent mis discrètement par Mistral sur le contrôle par l’entreprise pourrait bien porter ses fruits.

La mauvaise course

L’argument du contrôle par les entreprises est bien plus convaincant que le discours que j’avais l’habitude d’entendre. Vous savez, ce refrain selon lequel « l’Europe a besoin de son propre OpenAI ». Il existe certes un marché pour l’« IA souveraine » (ou « patriotique »), mais il est relativement restreint. Le marché bien plus vaste est constitué d’entreprises qui souhaitent simplement une IA qui fonctionne, qui coûte moins cher (ou offre plus) que prévu, et qui puisse être personnalisée tout en respectant leurs exigences de conformité.

Bien que la page de lancement initiale de l’entreprise ait pris soin de mentionner qu’elle opérait depuis l’Europe et avait son siège à Paris, depuis au moins octobre 2023, la stratégie produit de Mistral s’est centrée sur le contrôle dans les entreprises. Des termes tels que « personnaliser », « affiner », « open source » et « contrôle total » parsèment son site web actuel (et passé). Mistral présente Studio pour la création et l’exécution d’applications d’IA, Forge pour l’entraînement et l’alignement de modèles personnalisés, Vibe pour le travail agentique, Vibe for Code pour les workflows de codage, et Compute pour l’infrastructure d’entraînement et d’inférence. L’entreprise évoque l’observabilité, les évaluations, les garde-fous, la portabilité des déploiements et l’exécution de l’IA en production « de l'edge au cloud ». En d’autres termes, elle ressemble moins à une entreprise spécialisée dans les chatbots qu’à une entreprise d’infrastructure.

Ce positionnement devient plus clair lorsque l'on examine de plus près les noms des produits. Mistral AI Studio comprend un registre IA qui sert de système d’enregistrement pour les agents, les modèles, les ensembles de données, les évaluateurs, les outils et les workflows. Il assure le suivi de la traçabilité, de la propriété et des versions. Il applique des contrôles d’accès et des étapes de validation avant le déploiement. Il s’agit là d’une infrastructure de gouvernance « ennuyeuse » (et « ennuyeuse » est un terme positif dans l’informatique d’entreprise, comme je l’ai déjà écrit).

Forge est peut-être encore plus important. Mistral le décrit comme un moyen pour les entreprises d’entraîner des modèles de pointe sur leurs propres données propriétaires. Plutôt que de s’entraîner sur des informations protégées par des droits d’auteur appartenant à des tiers et éparpillées sur le Web ou sur une montagne de publications Reddit, Forge va bien au-delà de la génération augmentée par la recherche (RAG) : il ne se contente pas de « lire » des documents, informations, etc. propriétaires, mais offre en quelque sorte à l’entreprise son propre OpenAI privé.

Un cas extrêmement intéressant

Mais est-ce vraiment différent ? Je veux dire, OpenAI et Anthropic sont déjà tout à fait capables d’en faire autant, à plus grande échelle et en bénéficiant de modèles de pointe. Les deux disposent de produits d’entreprise, de partenariats cloud, d’évaluations, d’agents, d’outils de gouvernance et de diverses formes de personnalisation des modèles. Le pari de Mistral avec Forge ne repose pas sur le fait que les grands laboratoires ne peuvent pas personnaliser leurs modèles. C’est plutôt que certaines entreprises ne sont pas intéressées par la personnalisation en tant que fonctionnalité secondaire greffée sur une API de pointe. C’est le produit en soi. OpenAI et Anthropic peuvent tout construire autour de Forge, mais pas Forge lui-même, car la seule chose qu’ils ne souhaitent presque certainement pas vendre, c’est l’indépendance vis-à-vis d’eux.

C’est là que Mistral - incapable de suivre la course aux LLM - a peut-être trouvé une niche utile, qui lui permet de poser un autre type de questions. Et si le meilleur modèle d’entreprise n’était pas le modèle polyvalent le plus intelligent ? Et si le meilleur modèle était celui qui est suffisamment petit pour fonctionner là où le client en a besoin, suffisamment ouvert pour être inspecté et adapté, suffisamment abordable pour être largement utilisé, et suffisamment spécialisé pour remplir sa mission ? Et si « suffisamment bon, maîtrisable et qui vous appartient » l’emportait sur « légèrement plus intelligent, en grande partie opaque et loué » ?

Bien sûr, cela ne s’applique pas à tous les cas d’utilisation. Si je demande à l’IA d’analyser une feuille de calcul ou d’écrire du code, je voudrais probablement le meilleur modèle possible. Mais pour les banques, les agences de défense, les industriels, les services publics, les opérateurs télécoms et les gouvernements, la notion de « meilleur » est multidimensionnelle et inclut des aspects tels que la latence, l’auditabilité, etc. C’est pourquoi les banques, par exemple, continuent d’exécuter tant de charges de travail sur site : elles veulent garder le contrôle.

Qu’en est-il de la puissance de calcul ?

Rien de tout cela ne rend la puissance de calcul superflue. Mais cela pourrait changer la manière dont elle entre en jeu. Si Mistral tente de devenir une version française d’OpenAI, son manque de puissance de calcul à très grande échelle constitue une faiblesse fatale. L’entreprise ne dépensera jamais plus qu’OpenAI, Oracle, Microsoft, Google, Amazon, SpaceX ou Anthropic. Elle ne parviendra probablement pas non plus à les surpasser en matière de recrutement dans tous les domaines de recherche de pointe. Le marché de l’IA regorge déjà d’entreprises qui ont sous-estimé la rapidité avec laquelle un « bon modèle » est devenu « pas assez bon ». Mais si Mistral cherche à devenir la surcouche IA pour les entreprises qui ne veulent pas que toute l’intelligence repose derrière l’API d’un tiers, la question de la puissance de calcul devient plus nuancée. Elle a toujours besoin d’infrastructure, et Mistral semble en être conscient. Après tout, le fournisseur a levé 830 M$ de dette pour acheter 13 800 puces Nvidia destinées à un centre de données situé près de Paris. C’est bien sûr une goutte d’eau par rapport à OpenAI et Anthropic, mais la véritable question est de savoir si Mistral peut transformer ce relatif manque de moyens en atout, à l’image d’un principe de leadership d’Amazon intitulé « Frugalité », mais en version amplifiée.

Si une capacité de calcul réduite conduit Mistral à proposer des modèles plus petits, plus efficaces et plus spécialisés, ce qui aide à son tour les entreprises à garder un meilleur contrôle sur leurs données à moindre coût, alors « moins » devient bel et bien « plus ». Le défi de Mistral en matière de calcul n’est donc pas d’essayer de disposer d’autant de ressources GPU qu’OpenAI. Il s’agit plutôt d’amener les clients à se soucier moins de l’échelle brute de calcul et davantage de la flexibilité de déploiement, de la spécialisation et du contrôle. C’est un argument de vente difficile à faire passer. Mais ce n’est pas un argument stupide.

Ce que Mistral doit prouver

Les arguments défavorables restent évidents. OpenAI dispose d’une distribution grand public, d’une notoriété auprès des développeurs, de capitaux et d’une marque qui est pratiquement devenue synonyme d’IA. Anthropic est devenu le chouchou des développeurs et possède un parcours entreprise exceptionnellement solide. Google dispose des modèles, de l’infrastructure, des données et d’une multitude de services complémentaires. AWS, Microsoft et Oracle disposent de relations clients et d’infrastructures. Mistral doit prouver qu’il y a de la place pour un autre pôle d’attraction. Plus précisément, elle doit prouver trois choses.

Premièrement, elle doit montrer que l’IA openweight et contrôlable a suffisamment d’importance pour influencer les décisions d’achat, et pas seulement les tables rondes lors de conférences. Tout le monde dit vouloir le contrôle, tout comme la plupart apprécient l’idée de l’open source. Mais les logiciels propriétaires et les services cloud dominent toujours le marché. Mistral doit faire en sorte que le contrôle soit perçu comme une solution simple. Deuxièmement, elle doit prouver que la spécialisation l’emporte sur la généralité sur un nombre suffisant de marchés à forte valeur ajoutée. « Notre modèle est presque aussi bon » n’est pas une stratégie. « Notre modèle est meilleur pour votre banque, votre administration ou votre enseigne de distribution » pourrait bien l’être. Troisièmement, elle doit s’implanter dans l’informatique d’entreprise avant qu’OpenAI et Anthropic ne deviennent suffisamment « ennuyeux » pour satisfaire ces mêmes acheteurs. C’est là que se joue la véritable course. Les plus grandes entreprises d’IA recrutent des équipes commerciales dédiées aux entreprises, mettent en place des contrôles d’administration et concluent des accords avec tous les principaux fournisseurs cloud. Mistral dispose d’une fenêtre d’opportunité parce que le marché est encore jeune, mais cette fenêtre ne restera pas ouverte très longtemps.

Si l’IA reste une course à la performance des modèles, Mistral risque fort de perdre. Mais si l’IA continue d’évoluer pour devenir une infrastructure d’entreprise à part entière, Mistral a une réelle chance.