GPT-5.4 : OpenAI lance son premier modèle avec contrôle natif de l'ordinateur et 1 million de tokens

OpenAI a lancé GPT-5.4 ce jeudi 5 mars, son troisième modèle majeur en quelques semaines. La nouveauté principale : c’est le premier modèle grand public de l’entreprise à embarquer un contrôle natif de l’ordinateur. Concrètement, il peut prendre la main sur votre machine, naviguer entre les applications et accomplir des tâches complexes de bout en bout, sans que vous ayez à intervenir à chaque étape.

Un modèle qui pilote votre ordinateur

GPT-5.4 peut écrire du code pour opérer un ordinateur via des bibliothèques comme Playwright, mais aussi envoyer directement des commandes clavier et souris en analysant des captures d’écran. C’est ce que les ingénieurs appellent le « computer use natif » : le modèle n’a pas besoin d’une interface spéciale pour agir, il voit l’écran et clique comme un humain.

Sur le benchmark OSWorld-Verified, qui mesure la navigation bureau via captures d’écran, OpenAI affiche des résultats significatifs. Sur BrowseComp, qui évalue la recherche web persistante, GPT-5.4 gagne 17 points absolus par rapport à GPT-5.2, et la version Pro atteint 89,3%, un niveau inédit.

Voir l’annonce sur X

Deux variantes pour deux usages

GPT-5.4 se décline en deux versions. GPT-5.4 Thinking, disponible dès maintenant pour les abonnés ChatGPT Plus (20 $/mois) et au-dessus, présente un résumé de son raisonnement pour les requêtes complexes et permet à l’utilisateur de réorienter la réponse en cours de génération. GPT-5.4 Pro, réservé aux abonnés ChatGPT Pro (200 $/mois) et aux clients Enterprise, est taillé pour les tâches les plus exigeantes.

Les deux modèles sont disponibles dans l’API et dans Codex, l’environnement de développement d’OpenAI. Le contexte monte à 1 million de tokens, ce qui permet à des agents de planifier et d’exécuter des workflows longs sans perdre le fil. Attention : au-delà de 272 000 tokens d’entrée, le coût par million de tokens double.

Plus sobre, moins halluciné

OpenAI met également en avant l’efficacité : GPT-5.4 utilise 47 % de tokens en moins sur certaines tâches par rapport à ses prédécesseurs. Les affirmations incorrectes sont réduites de 33 % comparé à GPT-5.2, ce qu’OpenAI présente comme son « modèle le plus factuel à ce jour ».

Deux nouvelles intégrations accompagnent le lancement : GPT-5.4 peut désormais être branché directement dans Microsoft Excel et Google Sheets, permettant une analyse cellule par cellule et l’automatisation de tâches dans les tableurs d’entreprise.

Le pari de l’IA agentique

Ce lancement s’inscrit dans une course que se livrent OpenAI, Anthropic et Google pour imposer leurs agents IA dans les workflows professionnels. Avec GPT-5.4, OpenAI franchit un cap : son modèle phare n’est plus seulement un générateur de texte, c’est un agent capable d’agir dans le monde numérique. La vraie question, désormais, c’est jusqu’où les entreprises sont prêtes à laisser ces systèmes opérer de façon autonome.

Un modèle qui pilote votre ordinateur

Deux variantes pour deux usages

Plus sobre, moins halluciné

Le pari de l’IA agentique

À lire aussi

MolmoAct 2 : Ai2 sort un modèle robotique open source 37 fois plus rapide et un dataset bimanuel record de 720 heures

DAIMON Robotics ouvre 10 000 heures de données tactiles et veut donner aux robots un vrai sens du toucher

Samsung veut des usines 100 % pilotées par l’IA d’ici 2030 avec robots humanoïdes