Ce mardi, nous évoquions la présentation des dernières modèles de Mistral. La gamme comprend un LLM Large 3 basé sur une architecture MoE (mixture of experts) avec 675 milliards de paramètres (seul 41 milliards sont activés par token). Multimodal, il est capable de générer du texte et des images. Par ailleurs, il dévoile des SLM (small langage model) Ministral 3 se déclinant en 3, 8 ou 14 milliards de paramètres avec différentes versions : base (pré-entraîné), instruct (pour le chat) et reasoning (pour des tâches complexes). Ils peuvent fonctionner en local sur un PC, mais aussi sur des objets connectés.
A noter que les modèles sont disponibles en open source via une licence Apache 2.0. Plus exactement, il s’agit de modèles open weight, car la société - comme beaucoup d’autres - ne met pas à disposition ses données d’entraînement. Un changement de stratégie de la part de la start-up française qui avait orienté ses modèles vers des formats propriétaires en vue de les monétiser. Mais face à la concurrence importante d’OpenAI, Anthropic et Google, force est de constater que les revenus ne suivent pas. La société affiche un revenu annuel de 300 M€, une paille par rapport aux compétiteurs américains.
Une multiplication de partenariats
Pour autant, la société dirigée par Arthur Mensch multiplie les partenariats pour séduire les entreprises. Récemment, HSBC a signé un accord pluriannuel pour accélérer l’usage de le GenAI auprès de ses collaborateurs. Plusieurs métiers sont concernés : ainsi les commerciaux pourront créer rapidement des communications personnalisées et les responsables achats pourront identifier des potentiels sources d’économies. Stellantis avait fait de même en octobre dernier autour de deux axes : renforcer les équipes ventes et après-vente grâce à des analyses basées sur l’IA et améliorer l’efficacité opérationnelle.
Ces partenariats doivent s'amplifier dans le mois à venir. Mistral sera attendu au tournant pour la délivrance et la qualité de ses offres. Un temps en retrait, Gemini de Google devient le LLM sur lequel plusieurs DSI parient en ce moment. Idem pour Anthropic qui séduit les développeurs avec les capacités de codage de Claude Code.