OpenAI vient de dévoiler sa première puce maison, baptisée Jalapeño. Conçue avec Broadcom et Celestica, elle est dédiée à l’inférence, c’est-à-dire la phase où un modèle déjà entraîné génère ses réponses. L’entreprise franchit ainsi une étape majeure : après les modèles et les applications, elle dessine désormais le matériel qui les fait tourner.
Une puce taillée pour un seul usage
Contrairement aux accélérateurs IA généralistes, Jalapeño a été pensé spécifiquement pour l’inférence des grands modèles de langage. Son architecture est organisée autour des besoins de calcul, de mémoire, de réseau et de service des modèles modernes. OpenAI affirme que la puce réduit les déplacements de données tout en équilibrant ressources de calcul, mémoire et réseau, ce qui améliore l’utilisation du matériel.

Les premiers tests montreraient une performance par watt nettement supérieure à celle des accélérateurs IA actuels les plus avancés, même si les chiffres détaillés seront publiés plus tard. Des échantillons d’ingénierie font déjà tourner des charges de travail en laboratoire, dont GPT-5.3-Codex-Spark, aux fréquences et niveaux de puissance visés en production. Broadcom a apporté la mise en œuvre du silicium et ses technologies réseau, notamment sa plateforme Tomahawk.
Neuf mois de la conception à la fabrication
Selon les partenaires, Jalapeño a été développé de la conception initiale au tape-out de fabrication en seulement neuf mois. OpenAI décrit ce délai comme potentiellement le cycle de développement le plus rapide jamais atteint pour un semi-conducteur avancé de haute performance. Le processus a reposé sur une co-conception poussée entre les ingénieurs d’OpenAI et de Broadcom, et l’entreprise a même utilisé ses propres modèles d’IA pour accélérer une partie de la conception et de l’optimisation de la puce.
Greg Brockman, président et cofondateur d’OpenAI, présente Jalapeño comme un élément d’une stratégie d’infrastructure à long terme visant à rendre le calcul plus abondant. Richard Ho, qui dirige le programme matériel, ajoute que l’accélérateur a été optimisé autour des charges de travail les plus importantes pour les systèmes d’IA de pointe.
Cap sur les data centers à l’échelle du gigawatt
Les partenaires prévoient de déployer l’accélérateur dans des data centers à l’échelle du gigawatt dès 2026. Jalapeño est le premier produit de ce qu’OpenAI décrit comme une plateforme de calcul sur plusieurs générations, combinant ses propres accélérateurs, les technologies réseau de Broadcom et l’intégration système de Celestica. La puce est aussi pensée pour soutenir les futurs modèles de langage de l’ensemble du secteur, pas seulement ceux d’OpenAI.
L’enjeu est financier autant que technique. En maîtrisant son matériel, OpenAI cherche à réduire le coût et à améliorer l’efficacité d’exécution de ses modèles. Résultat attendu : des réponses ChatGPT plus rapides, des coûts d’exploitation IA plus bas et un accès plus fiable aux services avancés à mesure que la demande grimpe. Hock Tan, PDG de Broadcom, parle d’un engagement à dimensionner l’infrastructure physique nécessaire à la prochaine décennie de l’IA.