Donald Trump est bien décidé à imposer son tempo aux géants de l’IA américains. Après avoir contraint Anthropic à suspendre brutalement ses modèles Claude Fable 5 et Mythos 5, la Maison Blanche est encore à la manoeuvre. Cette fois pour empêcher OpenAI d’ouvrir à tous les utilisateurs sa dernière génération de modèles GPT 5.6. Le fournisseur a ainsi confirmé le bruit qui courait depuis vendredi dernier, en limitant ses trois derniers modèles Sol, Terra et Luna à des utilisateurs validés par l’administration américaine. « Dans le cadre de notre collaboration continue avec le gouvernement américain, nous avons présenté en beta nos projets et les capacités de ces modèles avant le lancement d'aujourd'hui », a expliqué OpenAI. « A leur demande, nous lançons dans un premier temps une preview limitée destinée à un petit groupe de partenaires de confiance, dont la participation a été signalée au gouvernement, avant de procéder à un déploiement à plus grande échelle. » Dans son annonce, le fournisseur américain indique continuer à se coordonner étroitement et réaliser des tests avec ses partenaires, avant de rendre ses modèles Sol, Terra et Luna disponibles pour tous.
Si l’éditeur ne pense pas qu’un tel processus d’accès des pouvoirs publics devienne la norme à long terme, il apparait cependant au pied du mur. « Nous prenons cette mesure à court terme car nous estimons qu'il s'agit du moyen le plus efficace d'assurer une plus large disponibilité dans les semaines à venir, tandis que nous travaillons avec l'administration à l'élaboration du cadre réglementaire issu de l’executive order présidentiel sur la cybersécurité et d'un processus reproductible pour les futures versions du modèle. » En début de mois, Donald Trump a signé ce décret demandant aux entreprises spécialisées dans l'intelligence artificielle disposant de modèles avancés de les soumettre volontairement pour examen 30 jours avant leur mise sur le marché. Mais le cadre régissant cette procédure n'a cependant pas encore été défini.
Une déclinaison Ultra basée sur des sous-agents
GPT-5.6 a été décliné en trois versions. Avec tout d’abord Sol, la plus performante, dotée de capacités de « raisonnement maximal » pour mener une réflexion approfondie et des protections avancées contre les cyberattaques. En matière de workflows de codage, GPT-5.6 Sol établit selon le fournisseur une référence sur Terminal-Bench 2.1, qui teste les workflows en ligne de commande nécessitant de la planification, des itérations et la coordination d’outils. A noter que le mode Ultra de ce modèle tire parti de sous-agents et accélère la réalisation de tâches complexes. GPT-5.6 Sol connait aussi des améliorations significatives dans les workloads liés à la biologie : au benchmark GeneBench v1, qui évalue les analyses génomiques et de biologie quantitative à long terme, il obtient ainsi de meilleurs résultats que GPT-5.5 tout en consommant moins de tokens. « GPT-5.6 Sol est notre modèle le plus performant à ce jour en matière de cybersécurité. Il repousse les limites en termes de rapport performances/efficacité pour les tâches de sécurité à long terme, notamment la recherche et l'exploitation de vulnérabilités », assure OpenAI. Sur ExploitBench, GPT-5.6 Sol rivaliserait avec Mythos Preview tout en n'utilisant qu'environ un tiers des jetons de sortie.
Les deux autres déclinaisons de de GPT-5.6 sont Terra, répondant à des besoins équilibrés pour un usage quotidien. Et Luna, un modèle qualifié de rapide et d’abordable. « Terra propose des performances comparables à celles du GPT-5.5 tout en étant deux fois moins cher, tandis que Luna propose des capacités élevées au meilleur prix », assure OpenAI. Pendant cette phase de pré-lancement, les modèles GPT-5.6 seront donc dans un premier temps accessibles via l'API et Codex à un groupe restreint de partenaires et entreprises de confiance. Le tarif de GPT-5.6 par million de tokens en entrée/sortie s’élève respectivement pour Sol à 5 $HT et 30 $HT (contre 10 $ HT en entrée et 50$ HT en sortie pour Claude Fable 5 d'Anthropic), pour Terra à 2,50 $HT et 15 $HT en sortie, et pour Luna à 1 $HT et 6 $HT. « GPT-5.6 introduit également une mise en cache des prompts plus prévisible et une durée de vie minimale du cache de 30 minutes », explique par railleurs OpenAI.