Ne pas laisser la concurrence occuper trop le terrain. Une semaine après le lancement d’Opus 4.7 d’Anthropic, OpenAI réplique en dévoilant GPT-5.5. Par rapport à son prédécesseur, il devient plus autonome pour l’automatisation des tâches. Auparavant, les utilisateurs devaient décrire chaque étape d’une tâche à automatiser sous peine d'erreurs. Le dernière modèle d’OpenAI est capable de comprendre les demandes même non précises pour planifier l’usage de logiciels tiers, vérifier leur travail et corriger les erreurs.
Des évolutions qui se traduisent par des performances améliorées sur plusieurs tests. L'un des tests les plus difficiles de la suite d'OpenAI est FrontierMath Tier 4. Il comprend des dizaines de problèmes mathématiques de niveau postdoctoral dont la résolution peut prendre plusieurs jours à un expert. GPT-5.5 Pro a obtenu un score de 39,6%, soit près du double des 22,9% atteints par Claude Opus 4.7.
Une tarification en forte hausse
Il bat aussi son concurrent sur les tâches de programmation. La version standard a obtenu un score de 82,7% (contre 69,7% pour Opus 4.7) sur Terminal-Bench 2.0, qui mesure la capacité des LLM à utiliser les outils en ligne de commande. Il rivalise même sur le codage avec le modèle Claude Mythos (82%) qui s’est fait connaître pour ses capacités en matière de cybersécurité et qui est en accès limité.
GPT-5.5 n’est pas non plus accessible à tous les utilisateurs de ChatGPT et Codex. Le fournisseur décline son modèle en deux versions : une standard et une Pro. La première est disponible pour les clients des forfaits Plus, Pro, Business et Enterprise, la seconde pour les seuls abonnés des trois derniers forfaits. Pour les développeurs se servant de l’API, les prix sont doublés par rapport à GPT-5.4 en passant à 5 $ HT par million de tokens en entrée (contre 2,5 auparavant) et 30 $ en sortie (15 auparavant). La facture grimpe avec la version Pro pour atteindre 180 $ HT par million de tokens en sortie. A titre de comparaison, Anthropic propose Opus 4.7 avec une tarification de 5 $ par million de tokens en entrée et 25 $ en sortie.