OpenAI a dégainé GPT-5.2, son dernier modèle de langage GPT 5.2, proposé en trois versions : Pro, Instant, et Thinking. « Globalement, GPT‑5.2 apporte des améliorations significatives en intelligence générale, compréhension de longs contextes, appel d’outils de façon agentique et vision », a expliqué l’éditeur. Il présente la version Pro comme son modèle le plus performant et le plus fiable pour les questions difficiles, lorsque la qualité de la réponse justifie d’attendre un peu plus longtemps. Lors des premiers tests, il a montré une précision accrue, moins d’erreurs majeures et de meilleures performances dans des domaines complexes comme la programmation. Concernant la déclinaison Instant, la société le qualifie de rapide pour le travail et l’apprentissage au quotidien avec des améliorations nettes sur les questions de recherche d’informations, les guides pratiques et pas à pas, la rédaction technique et la traduction. Enfin, Thinking a lui été conçu pour les besoins d’usages professionnels concrets (mise en forme de feuilles de calcul, création de présentation, modélisations financière...). « Pour les développeurs d’API, Thinking est notre modèle de pointe le plus avancé : il exécute avec encore plus de fiabilité des tâches de longue durée, il peut appeler plusieurs outils en parallèle sans se perdre et traite de grands volumes de documents et de données », explique OpenAI. 

Le fournisseur annonce avoir déployé GPT-5.2 dans ChatGPT en commençant par les abonnements payants (Plus, Pro, Business, Enterprise). A noter que GPT‑5.1 restera disponible pour les utilisateurs de ces plans pendant trois mois avant d’être retiré. Les trois versions de GPT‑5.2 sont disponibles dans l’API Responses. La version Pro de GPT-5.2 est facturée 21 $ HT par million de jetons en entrée et 168 $ en sortie, contre 1,75 $ et 14 $ pour les deux autres versions. OpenAI a fourni des benchmarks pour montrer les performances des trois versions de GPT-5.2. Un détail attire cependant l’attention : certains comme GDPval (tâches professionnelles), FrontierMath niveaux 1 à 3 (mathématiques avancées, et ARC-AGI 2 (raisonnement abstrait) n’ont pas été déterminés pour GPT-5.2 Pro. OpenAI n’aurait-il pas eu le temps de les exécuter et préféré communiquer rapidement sur toute sa gamme de modèles GPT-5.2 pour ne pas se laisser distancer par rapport à Google ?

Benchmarks GPT-5.2 OpenAI

Des résultats de benchmarks manquent à l'appel pour GPT‑5.2 Pro. (crédit : OpenAI)

Une bataille des LLM acharnée

Cette annonce est la suite d'une note de service envoyée le 1ᵉʳ décembre aux employés d'OpenAI où Sam Altman a émis un code rouge, et appelé à concentrer tous les efforts de l'entreprise sur l'amélioration de ChatGPT, passant de facto par celle de GPT. Une situation qui fait sourire quand on pense que Google avait sonné il y a trois ans le même type d'alerte face à... OpenAI. Les raisons de cet empressement ? Dans presque tous les benchmarks, le couple Gemini/Gemini 3 de Google surpassait en effet largement le duo ChatGPT/GPT-5.1. Dans ce contexte, l'avenir pourrait être sombre pour OpenAI si Gemini continue à surpasser ainsi GPT. Les conséquences pour Microsoft, son allié capitalistique qui utilise les modèles GPT-4 et GPT-5 pour alimenter son propre chatbot Copilot, sont moins évidents mais pourraient bien aussi se faire sentir.

Selon les analystes, il existe de nombreux domaines dans lesquels Gemini 3 surpasse GPT. Mayank Kejriwal, enseignant à l'USC Information Sciences Institute, affirme que le LLM de Google est celui qui a le plus évolué en termes de capacités cette année, tandis que GPT et d'autres n'ont bénéficié que de « mises à jour incrémentielles ». Il a déclaré à Business Insider que la dernière version de Gemini devance largement GPT dans le classement LMArena, dans lequel les utilisateurs évaluent la précision et l'exhaustivité des chatbots dans plusieurs domaines, notamment le texte, la conversion texte-image et la recherche. Gemini 3 occupe la première place du classement général, tandis que GPT-5.1 est loin derrière, à la sixième place. Google a publié un tas de benchmarks spécifiques qui montrent comment Gemini a surpassé GPT-5.1. L’alerte de M. Altman qui a suivi indique qu'il ne s'agit pas d'un simple battage médiatique. Et Google a immédiatement intégré Gemini 3 dans ses produits phares, y compris la recherche. Selon Sanchit Vir Gogia, analyste en chef chez Greyhound Research, l'intégration directe de Gemini dans Google Search est l'un des changements les plus importants sur le marché de l'IA d'entreprise au cours de la dernière année. « Il ne s'agit pas simplement d'une fonctionnalité d'IA ajoutée à la recherche, mais d'une refonte fondamentale du moteur mondial de distribution d'informations sur lequel des milliards de personnes comptent chaque jour », a-t-il expliqué. « Pour les entreprises, c’est un moment décisif où l'IA n'est plus une capacité distincte, mais l'interprète par défaut de l'intention de l'utilisateur, du contexte du flux de travail et de la récupération des connaissances. »

Des conséquences aussi pour Microsoft

Est-ce que cette bataille a une conséquence pour Microsoft ? Pour commencer, cette percée avérée de Google n'est pas aussi dangereuse qu'elle l'aurait été il y a un an. À l'époque, la firme de Redmond dépendait presque entièrement d'OpenAI. Mais l'entreprise a pris des mesures importantes pour renforcer, voire remplacer GPT comme solution GenAI de référence. Ces intentions sont devenues évidentes lorsque Microsoft a embauché Mustafa Suleyman, éminent spécialiste de l'IA, pour diriger sa nouvelle division IA en mars 2024. M. Suleyman est cofondateur et ancien directeur de l'IA appliquée chez DeepMind filiale de Google. Un an et demi plus tard, Microsoft a lancé ses premiers LLM développés en interne, qui pourraient à terme renforcer, voire remplacer GPT en tant que cerveau de Copilot. L'entreprise a également conclu un accord avec Anthropic, concurrent d'OpenAI, pour alimenter certaines parties de M365 Copilot, la version entreprise du chatbot qui s'intègre aux applications M365. Cet accord résout l'un des principaux problèmes de Copilot : ses capacités Excel sont extrêmement faibles, alors que celles du modèle Claude d'Anthropic sont bien meilleures.

Ce n'est qu'un début. À terme, la firme de Redmond pourrait adopter une approche best of breed qui s'appuie sur plusieurs LLM, et pas seulement sur GPT, pour alimenter Copilot. M. Suleyman a récemment annoncé une autre orientation pour les projets d'IA de Microsoft qui vont bien au-delà des chatbots actuels. Il la qualifie de « super intelligence Humaniste » et affirme qu'elle « résoudra des problèmes concrets et réels, tout en restant réaliste et contrôlable ». Ajoutant : « Nous ne construisons pas une super intelligence mal définie et éthérée ; nous construisons une technologie pratique explicitement conçue pour servir uniquement l'humanité. » Concrètement, cela signifie qu'il ne s'agit pas de chatbots universels comme ChatGPT et Gemini, mais plutôt d'une série de technologies basées sur l'IA, chacune visant à résoudre un problème important et à améliorer la vie des gens. Les deux premières technologies déployées concerneront la médecine et l'efficacité énergétique.