Les très grands modèles de langage reviennent en force pour les besoins de l'IA agentique. Dans ce cadre, Alibaba vient de dévoiler la dernière évolution de son LLM ouvert Qwen 3.5 adaptée aux agents dotés de capacités de raisonnement avancé. Multimodal,  il comprend le texte, les images et les vidéos. Dans un premier temps, Alibaba lance Qwen3.5-397B-A17B pour les développeurs, comprenant 397 milliards de paramètres mais où il est possible d’activer seulement 17 milliards de paramètres pour optimiser les tâches.

Sur la partie multilingue, le LLM supporte 201 langues et dialectes contre 119 auparavant. A noter que le fournisseur chinois lance également une version Qwen 3.5-Plus disponible dans la plateforme Model Studio d’Alibaba Cloud, avec une fenêtre d’1 million de tokens.  Dans son billet de blog, l’éditeur a mis en avant les gains réalisés dans certains benchmarks, affirmant que Qwen3.5 surpassait les versions précédentes et les systèmes concurrents de pointe comme GPT-5.2, Claude 4.5 Opus et Gemini 3 Pro.

Des implications pour l'IA en entreprise

Ce lancement intervient dans un contexte de concurrence croissante sur le marché chinois de l'IA. La semaine dernière, ByteDance a présenté Doubao 2.0, une mise à niveau de sa plateforme de chatbot, également positionnée autour de capacités agentiques. DeepSeek, dont l'ascension rapide à l'échelle mondiale l'année dernière a déstabilisé les investisseurs technologiques américains, devrait bientôt sortir son modèle de dernière génération. Selon les analystes, les améliorations apportées à Qwen3.5 en raisonnement et d'autres critères de référence sont significatives, en particulier pour les cas d’usage en entreprises. « Dans le cadre de projets pilotes, ces fonctionnalités aident les équipes à explorer de nouvelles interactions et à valider leur faisabilité », a expliqué Tulika Sheel, vice-présidente senior chez Kadence International. « Mais dans les environnements de production, les entreprises auront encore besoin de mesures de performance robustes, de garanties de fiabilité et de contrôles de gouvernance avant de leur faire pleinement confiance. »

Sanchit Vir Gogia, analyste en chef chez Greyhound Research, a souligné que Qwen3.5 n'est pas simplement un modèle de langage plus performant, mais un système capable de gérer des flux de travail. « Lorsque ces capacités sont combinées, le système cesse de se comporter comme un assistant conversationnel et commence à se comporter comme une couche d'exécution », a déclaré l’analyste. « C'est précisément là que convergent les opportunités et les risques. » Les DSI qui envisagent son adoption examineront la cohérence des performances du modèle à grande échelle et sa capacité à s'intégrer harmonieusement dans les cadres de gouvernance et d'infrastructure établis. Si les conditions sont réunies, les capacités multimodales et orientées agent de Qwen3.5 pourraient améliorer la façon dont les entreprises automatisent les fonctions de support et gèrent les informations entre les systèmes où le texte, les images et la façon d'interagir avec les données structurées. « La valeur est particulièrement tangible dans les environnements structurés, répétitifs et mesurables », a ajouté Sanchit Vir Gogia. « Par exemple, la validation des achats, la mise en correspondance des factures et des contrats, la sélection des fournisseurs et d'autres domaines similaires où les flux sont volumineux et soumis à des règles définies. »

Méfiance à l'égard des modèles chinois

Selon les analystes, le principal obstacle n'est peut-être pas le progrès technologique, mais la maturité et la confiance de l'écosystème, les préoccupations de sécurité continuant à limiter l'adoption mondiale. « Qwen3.5 excelle dans les capacités multimodales et offre un large choix de modèles, y compris des options de modèles ouverts pour un accès et une personnalisation plus faciles », a reconnu Anushree Verma, analyste senior chez Gartner. « Cependant, le principal défi pour Qwen est son adoption mondiale, limitée en raison d'une disponibilité commerciale restreinte, de la méfiance à l'égard des modèles d'origine chinoise et d'un écosystème de partenaires moins mature en dehors de la Chine. »

Par ailleurs, M. Gogia estime aussi que l'évaluation de Qwen3.5 par une entreprise américaine ne peut se réduire à des mesures de performance de modèle. « Elle doit être envisagée comme une évaluation de la durabilité », a expliqué M. Gogia. « Cette plateforme peut-elle rester viable, conforme et stable sur le plan opérationnel malgré la volatilité des politiques ? », a-t-il demandé. Mme Sheel recommande d’évaluer la conformité aux réglementations régionales, y compris les obligations en matière de résidence des données et les lois sur la confidentialité, avant tout déploiement. « Les DSI doivent également déterminer qui peut accéder aux données de l'entreprise ou les traiter, et si les garanties contractuelles et les mécanismes d'audit sont conformes aux normes de gouvernance interne. »