Les modèles IA open weight gagnent du terrain

Même si les grands modèles de langage restent populaires, les responsables IT s'intéressent de plus en plus à des modèles ouverts, de taille plus modeste, qui pourraient mieux répondre aux besoins en IA des entreprises.

Si les modèles IA propriétaires tels que ChatGPT d’OpenAI et Google Gemini restent populaires, les modèles ouverts dotés de meilleures capacités de personnalisation pour un coût maitrisé séduisent les responsables informatique. Ces modèles open weight sont des alternatives aux grands modèles de langage et peuvent offrir aux décideurs une meilleure visibilité et un meilleur contrôle sur l’utilisation interne de l’IA contrairement aux modèles fermés, selon des analystes. Ces modèles peuvent également aider les responsables IT à maîtriser les aspects économiques et la gouvernance de l’IA au sein de leur entreprise. « Les modèles ouverts sont un peu comme des toiles vierges que l’on peut peindre soi-même », a expliqué Deepak Seth, analyste senior chez Gartner. « Il n’est pas nécessaire de créer la toile, ce qui signifie que l’on ne part pas de zéro, même lorsque l’on construit son propre modèle. »

Les modèles ouverts sont gratuits à télécharger et à utiliser. On peut les modifier et les déployer pour répondre à ses propres besoins, de la même manière que le système d'exploitation Linux est accessible à tous pour être téléchargé, modifié et utilisé. « Les modèles ouverts gagnent du terrain car de plus en plus de cas d’usage voient le jour », a déclaré Jesse Williams, cofondateur et directeur des opérations chez Jozu, une entreprise spécialisée dans les outils IA. « L'open source est plus flexible et peut être utilisé dans des contextes où les modèles propriétaires ne sont parfois pas fiables », a souligné M. Williams. « Les modèles propriétaires gagnent en popularité et nous constatons que leur adoption est bien plus rapide que celle de n’importe quelle autre technologie auparavant, et cette tendance persiste », a-t-il ajouté. Il estime aussi que la popularité croissante des modèles ouverts ne devrait pas être considérée comme une simple réaction de rejet des LLM.

Des modèles nécessitant de tâtonner

Parmi les modèles ouverts populaires, on peut citer Llama de Meta, Mistral, DeepSeek et Minimax. Les fournisseurs d’IA générative propriétaire ont également publié des versions open source de leurs LLM. C’est le cas de Gemma de Google, qui est une ramification de Gemini, de GPT-OSS d’OpenAI et de Phi de Microsoft. Même s’il est possible d’affiner ces modèles pour répondre aux besoins spécifiques des entreprises, ils ne partagent pas les sources de données sur lesquelles ils ont été entraînés. « Par rapport aux LLM propriétaires, les modèles ouverts proposés par Google et OpenAI sont entraînés sur des volumes de données plus faibles et peuvent ne pas être aussi performants », a indiqué Max Leaming, responsable des solutions data science et IA chez ManpowerGroup. Par conséquent, les modèles ouverts nécessitent des essais pour trouver la bonne application. « En particulier, il faut chercher pour quelle application le modèle est performant, car aucun de ces modèles n’est véritablement polyvalent », a-t-il précisé. Des entreprises comme ServiceNow, Microsoft, HubSpot et RWS ont fait valoir que les modèles ouverts s’intègrent plus facilement aux infrastructures IA, réduisent les coûts IT et sont compatibles avec les workflows basés sur l’IA agentique.

« Les récentes pannes chez des fournisseurs de modèles fermés comme Anthropic et OpenAI obligent également les DSI à réfléchir à la dépendance vis-à-vis d’un fournisseur et à la nécessité d’intégrer des modèles ouverts pour renforcer la résilience de l’IA », a pointé Max Goss, directeur de recherche senior chez Gartner. « La course à l’IA n’en est encore qu’à ses débuts. Les DSI doivent être conscients de l’usage qu’ils font de l’IA, des alternatives possibles et du plan de secours », a-t-il ajouté. En raison de leurs coûts réduits et d’une meilleure sécurité, les modèles ouverts offrent souvent une bonne option pour un déploiement sur site. « Et les données ne sont pas exposées au fournisseur qui pourrait les utiliser pour littéralement entraîner des modèles destinés à nos concurrents », a fait remarquer M. Leaming de ManpowerGroup. « Ces modèles peuvent aussi être utilisés en robotique, un domaine où ils fournissent aux robots un langage de communication universel », a déclaré pour sa part Rev Lebaredian, vice-président de la simulation physique de l’IA chez Nvidia, qui s’est exprimé lors d’une conférence de presse précédant le salon GTC de l’entreprise plus tôt cette année. « La pile robotique IA de Nvidia est en grande partie open source, ce qui « permet de relier l’ensemble de l’écosystème robotique », a fait valoir M. Lebaredian.

Un pilier pour l'IA souveraine

Les modèles ouverts jouent également un rôle dans la promotion de la souveraineté numérique en Europe et ailleurs. La France, par exemple, fonde sa stratégie d’IA souveraine sur Mistral, tandis que les Émirats arabes unis (United Arab Emirates, UAE) disposent de K2 Think V2, développé par la Mohamed bin Zayed University of Artificial Intelligence (MBZUAI), G42 et le fabricant de puces Cerebras Systems qui vient de réaliser son IPO à 5,5 Md$. « Les modèles ouverts sont importants pour l’IA souveraine afin que les nations puissent comprendre, adapter et contrôler les systèmes qui alimentent l’infrastructure numérique », a estimé Richard Morton, vice-président et directeur général de l’Institute of Foundation Models à la MBZUAI. Le K2 Think V2 de la MBZUAI donne aux pays la possibilité de développer une IA alignée sur leurs propres priorités, langues, valeurs et besoins en matière de sécurité. « Pour nous, la souveraineté revient en fin de compte à une appropriation significative de la technologie elle-même », a expliqué M. Morton.

Malgré l’intérêt croissant qu’ils suscitent, les modèles ouverts comportent certains risques de sécurité. Par exemple, selon une étude publiée par le ministère britannique des Sciences, de l’Innovation et de la Technologie et l’AI Security Institute, des acteurs malveillants pourraient pirater des systèmes à l’aide de commandes malveillantes, ou utiliser la technologie d’IA pour lancer des attaques. Selon l’étude présidée par Yoshua Bengio, pionnier de l’apprentissage profond, les modèles imparfaits présentant des vulnérabilités pourraient servir de point d’entrée aux pirates informatiques pour s’introduire dans les systèmes d’entreprise. « Contrairement aux modèles fermés où les hébergeurs peuvent déployer des correctifs de manière universelle, les développeurs de modèles à poids ouverts ne peuvent garantir que les mises à jour seront adoptées par les utilisateurs », indique cette étude.

Sur le même thème

Partenaires

Les modèles IA open weight gagnent du terrain

Livres blancs

Des modèles nécessitant de tâtonner

Un pilier pour l'IA souveraine

Commentaire

Suivre toute l'actualité

Newsletter

Livres blancs

Des modèles nécessitant de tâtonner

Un pilier pour l'IA souveraine

Newsletter LMI

Commentaire

Suivre toute l'actualité

Newsletter