Intelligence Artificielle

OpenAI ouvre GPT-5.5 dans son API : le modèle pense plus juste et consomme moins de tokens

Par La Rédaction ⏱ 4 min de lecture

OpenAI a ouvert son nouveau modèle GPT-5.5 dans l’API à la fin de la journée du 24 avril 2026. La société présente cette version comme son agent généraliste le plus capable, avec un atout présenté comme central pour les développeurs : terminer une tâche complexe avec moins de tokens que GPT-5.4 et moins de retries.

L’annonce a été confirmée par Romain Huet, responsable des relations développeurs chez OpenAI, dans un message publié sur X dans la nuit du 24 au 25 avril. La page officielle Introducing GPT-5.5 a été mise à jour pour signaler la disponibilité immédiate de GPT-5.5 et GPT-5.5 Pro dans l’API, alors que ces modèles n’étaient jusqu’ici accessibles que via ChatGPT et Codex.

Un modèle pensé pour l’agentique et le travail réel

OpenAI positionne GPT-5.5 comme une étape vers une nouvelle façon d’utiliser un ordinateur. Concrètement, le modèle est conçu pour planifier une tâche complète, utiliser des outils, vérifier son propre travail et naviguer dans l’ambiguïté sans micro-pilotage humain. La société cite l’écriture et le débogage de code, la recherche en ligne, l’analyse de données, la création de documents et la conduite de logiciels comme zones de progrès.

Sur le banc Terminal-Bench 2.0, qui teste des workflows complexes en ligne de commande avec planification et coordination d’outils, GPT-5.5 atteint 82,7 % de réussite. Le précédent GPT-5.4 plafonnait à 75,1 %. Claude Opus 4.7 reste à 69,4 % et Gemini 3.1 Pro à 68,5 % sur ce même test.

Sur SWE-Bench Pro, qui mesure la capacité à résoudre de vrais tickets GitHub en un seul passage, GPT-5.5 grimpe à 58,6 %. Sur OSWorld-Verified, qui teste l’usage d’un système d’exploitation, le modèle atteint 78,7 %, contre 75 % pour GPT-5.4.

Moins de tokens pour le même résultat

L’autre angle martelé par OpenAI tient à l’efficacité. Greg Brockman, président de la société, a précisé au site Inc. que GPT-5.5 est «un penseur plus rapide et plus précis pour moins de tokens». Le calcul intéresse directement les éditeurs et entreprises qui paient à l’usage : moins de tokens consommés signifie moins de coûts par requête traitée.

OpenAI affirme qu’à latence par token équivalente, GPT-5.5 produit «un niveau d’intelligence largement supérieur» sans rallonger les temps de réponse. Sur le Coding Index d’Artificial Analysis, le modèle est annoncé à la moitié du coût des autres modèles frontière en codage.

API et coût : un déploiement progressif

La sortie API du 24 avril complète le déploiement entamé fin mars dans ChatGPT et Codex. Plus, Pro, Business et Enterprise utilisent déjà la nouvelle version. L’arrivée dans l’API était présentée la semaine passée comme imminente, le temps de finaliser les garde-fous spécifiques à un usage à grande échelle.

Selon le décryptage publié par Decrypt, GPT-5.5 reste plus cher que la version 5.4 sur certains tarifs et l’écart d’efficacité revendiqué dépend des charges de travail. Les développeurs sont invités à demander à Codex de migrer leurs intégrations Responses API vers GPT-5.5 pour mesurer eux-mêmes l’écart.

Pourquoi cela compte pour la robotique et l’IA physique

GPT-5.5 ne pilote pas un robot. Mais l’agentique reste au cœur des architectures de planification utilisées par les humanoïdes industriels et les pipelines IA physique. Les startups qui combinent un modèle de langage géant pour la décision haut niveau et un modèle d’action pour le contrôle moteur, comme on l’a vu chez Figure, X Square ou AGIBOT, surveillent de près les gains agentiques. Une réduction de la consommation de tokens et une meilleure orchestration d’outils peut faire baisser sensiblement le coût marginal d’une tâche pilotée par un humanoïde dans un entrepôt.

Reste à voir si les benchmarks tiendront en production réelle. Les retours d’usage dans Codex au cours des prochaines semaines donneront le ton.