OpenAI dévoile Jalapeño, sa première puce maison dédiée à l'inférence et conçue en neuf mois avec Broadcom

OpenAI vient de dévoiler sa première puce maison, baptisée Jalapeño. Conçue avec Broadcom et Celestica, elle est dédiée à l’inférence, c’est-à-dire la phase où un modèle déjà entraîné génère ses réponses. L’entreprise franchit ainsi une étape majeure : après les modèles et les applications, elle dessine désormais le matériel qui les fait tourner.

Une puce taillée pour un seul usage

Contrairement aux accélérateurs IA généralistes, Jalapeño a été pensé spécifiquement pour l’inférence des grands modèles de langage. Son architecture est organisée autour des besoins de calcul, de mémoire, de réseau et de service des modèles modernes. OpenAI affirme que la puce réduit les déplacements de données tout en équilibrant ressources de calcul, mémoire et réseau, ce qui améliore l’utilisation du matériel.

Puce IA personnalisee OpenAI Jalapeno sur carte de circuit — Illustration RoboActu

Les premiers tests montreraient une performance par watt nettement supérieure à celle des accélérateurs IA actuels les plus avancés, même si les chiffres détaillés seront publiés plus tard. Des échantillons d’ingénierie font déjà tourner des charges de travail en laboratoire, dont GPT-5.3-Codex-Spark, aux fréquences et niveaux de puissance visés en production. Broadcom a apporté la mise en œuvre du silicium et ses technologies réseau, notamment sa plateforme Tomahawk.

Neuf mois de la conception à la fabrication

Selon les partenaires, Jalapeño a été développé de la conception initiale au tape-out de fabrication en seulement neuf mois. OpenAI décrit ce délai comme potentiellement le cycle de développement le plus rapide jamais atteint pour un semi-conducteur avancé de haute performance. Le processus a reposé sur une co-conception poussée entre les ingénieurs d’OpenAI et de Broadcom, et l’entreprise a même utilisé ses propres modèles d’IA pour accélérer une partie de la conception et de l’optimisation de la puce.

Greg Brockman, président et cofondateur d’OpenAI, présente Jalapeño comme un élément d’une stratégie d’infrastructure à long terme visant à rendre le calcul plus abondant. Richard Ho, qui dirige le programme matériel, ajoute que l’accélérateur a été optimisé autour des charges de travail les plus importantes pour les systèmes d’IA de pointe.

Cap sur les data centers à l’échelle du gigawatt

Les partenaires prévoient de déployer l’accélérateur dans des data centers à l’échelle du gigawatt dès 2026. Jalapeño est le premier produit de ce qu’OpenAI décrit comme une plateforme de calcul sur plusieurs générations, combinant ses propres accélérateurs, les technologies réseau de Broadcom et l’intégration système de Celestica. La puce est aussi pensée pour soutenir les futurs modèles de langage de l’ensemble du secteur, pas seulement ceux d’OpenAI.

L’enjeu est financier autant que technique. En maîtrisant son matériel, OpenAI cherche à réduire le coût et à améliorer l’efficacité d’exécution de ses modèles. Résultat attendu : des réponses ChatGPT plus rapides, des coûts d’exploitation IA plus bas et un accès plus fiable aux services avancés à mesure que la demande grimpe. Hock Tan, PDG de Broadcom, parle d’un engagement à dimensionner l’infrastructure physique nécessaire à la prochaine décennie de l’IA.

Une puce taillée pour un seul usage

Neuf mois de la conception à la fabrication

Cap sur les data centers à l’échelle du gigawatt

À lire aussi

Hugging Face lance le LeRobot Humanoid, un robot bipède open source imprimé en 3D à 2 500 dollars

Humble Robotics veut lancer ses camions sans cabine en Californie, les Teamsters montent au créneau

XPENG démarre la production de masse de son robotaxi GX à Guangzhou et grille la politesse à Tesla et Waymo