Industrie

Microsoft dégaine MAI-Code-1-Flash et MAI-Thinking-1 au Build 2026 pour réduire sa dépendance à OpenAI et casser le coût du token

Par La Rédaction ⏱ 4 min de lecture

Microsoft a dévoilé mardi 2 juin 2026 deux nouveaux modèles d’intelligence artificielle maison à son Build 2026 de San Francisco. MAI-Code-1-Flash transforme des descriptions textuelles en code applicatif, et MAI-Thinking-1 ajoute une capacité de raisonnement à moyenne échelle. Derrière la double annonce, Satya Nadella affiche un objectif clair : faire tourner davantage de charges IA sur l’infrastructure Azure, sans payer la note d’OpenAI.

Une réponse directe au coût du token

Le marché du « vibe coding », ces outils qui génèrent des applications à partir d’une simple consigne en langage naturel, a explosé en six mois. Microsoft veut récupérer cette manne en proposant son propre moteur. MAI-Code-1-Flash sera disponible dès le lancement dans GitHub Copilot et Visual Studio Code. Kyle Daigle, patron du marketing développeur chez Microsoft et COO de GitHub, qualifie ce modèle d’« ultra-efficient à l’inférence ».

Le second modèle, MAI-Thinking-1, vise les cas d’usage qui réclament du raisonnement structuré. Il arrive en private preview via Microsoft Foundry, la plateforme d’intégration de modèles dans les applications d’entreprise. Daigle insiste sur la combinaison « haute performance et faible coût-token ». Le token reste l’unité de facturation qui détermine le budget IA des développeurs, et c’est là que Microsoft tape.

Mustafa Suleyman, patron de Microsoft AI, a livré le chiffre qui résume la bataille en cours. Après un affinage des modèles pour les besoins du cabinet McKinsey, Microsoft affirme avoir dépassé GPT-5.5 d’OpenAI avec un rapport coût-efficacité dix fois meilleur. La revendication mérite vérification indépendante, mais elle signe la posture commerciale : Azure veut devenir un foyer où l’entreprise « participe pleinement à l’écosystème frontière » plutôt que d’en consommer les modèles, pour reprendre la formule de Satya Nadella sur scène.

L’arrière-plan financier d’une émancipation

Microsoft a injecté 13 milliards de dollars dans OpenAI et 5 milliards dans Anthropic. Les deux modèles fondateurs restent disponibles sur Azure, mais la situation se tend. Anthropic a déposé un dossier d’introduction en bourse confidentiel le 1er juin. OpenAI prépare également une IPO, possiblement dans l’année. Ces deux entrées en bourse vont libérer leurs choix stratégiques et leurs prix de catalogue, au moment où le coût des modèles frontières s’envole.

Google a sorti en mai Gemini 3.5 Flash, capable de coder et de tourner sur les datacenters maison. Microsoft applique la même recette. Le projet MAI est donc un mouvement défensif autant qu’offensif : sécuriser une partie du stack pour ne plus dépendre d’un fournisseur qui peut, demain, devenir un concurrent direct sur le marché entreprises.

Reconnaissance vocale, génération d’images et Aion pour les PC Windows

L’annonce Build 2026 ne se limite pas aux deux modèles. Microsoft met aussi à jour ses briques cloud pour la reconnaissance vocale, la synthèse vocale et la génération d’images. La société présente également Aion, une famille de petits modèles destinés à tourner localement sur Windows PC. Cette descente vers le poste de travail confirme la stratégie : occuper toutes les couches du stack IA, du datacenter au laptop.

Cette annonce fait écho au mouvement plus large des hyperscalers américains. NVIDIA a publié Nemotron 3 Ultra à Computex Taipei. Alphabet lève 80 milliards de dollars pour étoffer son infrastructure IA. Et SoftBank engage 75 milliards d’euros sur les Hauts-de-France. Chacun veut sa souveraineté sur le calcul et sur les modèles. Microsoft assume désormais la sienne, en frontal.

Pour les développeurs et les éditeurs européens, le calcul devient plus simple. Le terrain Azure se densifie en modèles propriétaires Microsoft, ce qui devrait peser à la baisse sur le prix moyen du token. Reste à voir si les benchmarks indépendants confirmeront le « 10x » revendiqué face à GPT-5.5, et si MAI-Code-1-Flash tiendra la cadence des spécialistes du vibe coding comme Cursor, Lovable ou Replit Agent.

Sources : CNBC, Microsoft Blog.