OpenAI a sorti mardi GPT-5.5 Instant, un nouveau modèle qui devient le défaut de ChatGPT. Il remplace GPT-5.3 Instant et promet moins d’hallucinations sur les sujets sensibles comme la santé, le droit ou la finance, sans sacrifier la latence.
L’annonce est tombée le 5 mai 2026. C’est la deuxième fois en deux semaines qu’OpenAI déploie un cran de la famille GPT-5.5, après une première version sortie en avril positionnée sur le code et la connaissance métier. La nouveauté ici : « Instant » est le sous-modèle taillé pour la conversation rapide, celui qui répond par défaut aux centaines de millions d’utilisateurs ChatGPT quand ils n’activent pas le mode raisonnement.

Des chiffres qui montent vite
OpenAI met en avant deux benchmarks. Sur AIME 2025, le test de mathématiques de haut niveau, GPT-5.5 Instant atteint 81,2, contre 65,4 pour le modèle précédent. Sur MMMU-Pro, qui mesure le raisonnement multimodal, il monte à 76 contre 69,2. C’est un saut important pour un modèle « rapide », qui jusqu’ici servait surtout à tenir la latence sous la seconde au détriment de la profondeur.
Le point que met le plus en avant l’éditeur, c’est la baisse des hallucinations sur les domaines à risque. Médecine, droit, finance. C’est devenu le terrain de bataille des chatbots grand public, avec des litiges potentiels à la clé pour les éditeurs qui laissent leurs modèles inventer des dosages ou des jurisprudences.
La mémoire prend une place centrale
L’autre nouveauté concerne la mémoire conversationnelle. GPT-5.5 Instant peut désormais utiliser un outil de recherche pour piocher dans les conversations passées, les fichiers et même les e-mails Gmail de l’utilisateur, pour produire des réponses personnalisées. La fonctionnalité est d’abord disponible pour les abonnés Plus et Pro sur le web, avec une extension prévue à mobile, puis aux utilisateurs Free, Go Business et entreprise dans les semaines qui viennent.
OpenAI a aussi ajouté un système de « sources de mémoire » affichées sur tous les modèles. L’utilisateur voit d’où vient une réponse, peut supprimer des sources obsolètes ou les corriger. Si une conversation est partagée avec un tiers, ces sources restent privées.
Du côté des développeurs et de l’API
Le modèle arrive dans l’API OpenAI sous le nom « chat-latest ». Les paid users gardent la possibilité d’utiliser GPT-5.3 pendant trois mois avant retrait. C’est une fenêtre courte, qui suggère qu’OpenAI veut accélérer la migration de sa base d’utilisateurs payants vers la nouvelle génération.
L’éditeur n’a pas oublié le précédent malheureux de GPT-4o, dont la dépréciation en février 2026 avait provoqué une vague de protestations parmi les utilisateurs attachés à la « personnalité » du modèle. Cette fois, la transition est progressive et accompagnée d’un argumentaire produit centré sur la fiabilité plutôt que sur la disparition.
Pourquoi c’est important
Pour la communauté robotique et IA, GPT-5.5 Instant n’est pas qu’un chatbot grand public. C’est aussi le modèle qui sert de cerveau conversationnel à des millions d’agents et d’intégrations métier, des copilotes industriels aux assistants embarqués. Une réduction des hallucinations en environnement sensible, doublée d’une mémoire persistante, change directement la qualité des produits qui s’appuient sur l’API. La compétition reste serrée, avec Claude Mythos Preview en tête sur GPQA Diamond et Gemini 3 Pro qui tient la dragée haute en code, mais OpenAI s’assure de garder le défaut de ChatGPT toujours un cran au-dessus.