NVIDIA a profité du Computex 2026 à Taipei pour dévoiler Nemotron 3 Ultra, son plus gros modèle d’IA open-weight à ce jour. 550 milliards de paramètres, mixture-of-experts à 55 milliards actifs, contexte d’un million de tokens : le constructeur reprend la tête du classement américain des modèles ouverts, mais reste six points derrière le chinois Kimi K2.6 sur l’index Artificial Analysis.
Jensen Huang a fait l’annonce le 1er juin sur la scène du Taipei Nangang Exhibition Center, blouson cuir et chiffres à l’appui. Le modèle est livré dès le 4 juin, avec ses poids publics et ses recettes d’entraînement documentées sur le portail développeur de NVIDIA.
Une architecture hybride pensée pour l’agent autonome
Nemotron 3 Ultra combine trois briques techniques : des couches Mamba-2 pour traiter les longues séquences à coût réduit, l’attention Transformer classique, et un routage mixture-of-experts qui n’active que 55 milliards de paramètres sur les 550 disponibles. L’idée : conserver l’étendue de connaissances d’un très gros modèle tout en gardant le coût d’inférence sous contrôle.
Le contexte d’un million de tokens permet à un agent de garder en mémoire une base de code entière ou plusieurs centaines de documents simultanément. Le modèle utilise aussi le multi-token prediction (MTP), qui génère plusieurs tokens à la fois plutôt qu’un par un. Résultat mesuré sur un endpoint DeepInfra pré-lancement : plus de 300 tokens par seconde, soit trois à six fois plus rapide que DeepSeek V4 Pro ou Kimi K2.6 sur leurs API commerciales.
L’index Artificial Analysis place Nemotron à 48 points
L’évaluateur indépendant Artificial Analysis, partenaire de NVIDIA pour la mesure pré-lancement, attribue à Nemotron 3 Ultra un score d’intelligence de 48. Le saut par rapport à Nemotron 3 Super (mars 2026, 120 milliards de paramètres) atteint douze points. Le modèle prend une avance confortable sur le reste du paysage américain open-weight : Gemma 4 31B de Google plafonne à 39, Nemotron 3 Super à 36, et gpt-oss-120b d’OpenAI à 33.
Le problème pour Washington, c’est ce qui se passe au-dessus. Kimi K2.6 du laboratoire chinois Moonshot AI, sorti en avril 2026, affiche un score d’intelligence de 54. Soit six points devant Nemotron 3 Ultra. Kimi K2.6 occupe d’ailleurs le quatrième rang mondial tous modèles confondus, juste trois points derrière les flagships fermés d’Anthropic, Google et OpenAI, tous trois à 57. Et DeepSeek V4 Pro reste également au-dessus de Nemotron sur cet index composite qui agrège dix évaluations de raisonnement, code, connaissances générales et performance agentique.
Une bataille à 26 milliards de dollars
NVIDIA assume le rôle de fer de lance américain de l’open-weight. Le constructeur a annoncé un plan quinquennal de 26 milliards de dollars d’investissement dans le développement de modèles ouverts. La part de marché mondiale des modèles open-source chinois est passée d’environ 1,2 % fin 2024 à près de 30 % fin 2025, et NVIDIA cherche à inverser cette dynamique avec Mistral AI, Perplexity et six autres labos réunis au sein de la Nemotron Coalition lancée en mars 2026. La prochaine génération, Nemotron 4, est déjà en chantier sur l’infrastructure DGX Cloud.
L’enjeu dépasse la guerre des classements. Les modèles open-weight servent de base aux déploiements industriels souverains, notamment dans la robotique embarquée où le contrôle des poids permet de faire tourner l’IA sans appel API externe. C’est exactement le terrain sur lequel NVIDIA pousse aussi avec Isaac GR00T et son partenariat élargi aux constructeurs européens et coréens. Nemotron 3 Ultra n’est pas seulement un modèle, c’est une brique d’écosystème.
Notre analyse
NVIDIA gagne le match américain, mais perd la finale mondiale. Avec 48 points d’intelligence, Nemotron 3 Ultra creuse un écart inédit sur Google, OpenAI et Meta côté ouvert. Le hic, c’est que ces trois acteurs gardent leurs meilleurs modèles fermés derrière des API payantes. Côté chinois, Moonshot AI, DeepSeek et Alibaba publient leurs poids et tirent l’écosystème open-weight vers le haut sans contrepartie commerciale immédiate.
La vraie nouveauté tient au positionnement de NVIDIA. Le constructeur de GPU se mue en éditeur de modèles, ce qui ajoute une couche logicielle à un empire jusqu’ici essentiellement hardware. Avec 26 milliards de dollars de budget sur cinq ans et une coalition d’éditeurs indépendants comme Mistral, NVIDIA verrouille sa position de plateforme de référence : tu loues les chips, tu utilises les modèles, et l’ensemble tourne sur la pile Isaac pour la robotique. La stratégie est claire. Reste à savoir si elle suffira à rattraper Pékin sur le terrain de l’intelligence pure.