Gemini 3.2 Flash fuite dans Google AI Studio et l'app iOS, à 10 jours d'un Google I/O qui sera centré sur les agents IA

Google n’a encore rien annoncé, mais le code parle pour lui. Gemini 3.2 Flash, le successeur attendu de Gemini 3.1 Flash, a été repéré dans Google AI Studio et dans des builds iOS de l’application Gemini depuis le 5 mai. Le modèle apparaît avec un prix de 0,25 dollar par million de tokens en entrée, soit le même tarif que le Flash actuel. La sortie officielle devrait coller à Google I/O, prévu autour du 19 mai. Polymarket donne déjà 83 % de probabilité à un lancement à cette date.

Une apparition dans l’API avant l’annonce officielle

Les premières traces de Gemini 3.2 Flash sont apparues dans la console développeur de Google AI Studio, avec un tarif déjà affiché et un endpoint déjà câblé. Cette pratique est devenue récurrente chez les grands laboratoires d’IA. OpenAI, Anthropic et Google testent souvent leurs modèles dans des environnements semi-publics quelques jours avant le lancement officiel, pour valider la stabilité de l’API à l’échelle. Le revers de la médaille : la fuite est garantie.

Côté grand public, des builds iOS de l’application Gemini ont également exposé une interface redessinée et des références à Gemini Canvas, une fonctionnalité d’édition collaborative déjà testée dans la version desktop. L’ensemble pointe vers un I/O 2026 entièrement orienté agents IA, productivité multimodale et intégration mobile.

Un Flash positionné comme alternative low-cost à Gemini 3.1 Pro

Le positionnement tarifaire est sans ambiguïté. À 0,25 dollar le million de tokens en entrée, Gemini 3.2 Flash reste calé sur le palier Flash actuel, soit huit fois moins cher en entrée que Gemini 3.1 Pro (2,00 dollars par million sous 200 000 tokens). Les premiers retours évoquent un modèle qui se rapprocherait des performances de la version Pro précédente, notamment sur les benchmarks de raisonnement et de coding, tout en conservant la latence éclair du Flash.

Pour Google, l’enjeu est clair : tenir tête à GPT-5.5 d’OpenAI et à Claude Opus 4.7 d’Anthropic, qui se disputent actuellement le haut du classement sur LMSYS Chatbot Arena. La stratégie est de couper le marché en deux : Pro pour les usages haut de gamme, Flash pour le volume et les agents. Anthropic et OpenAI utilisent la même segmentation avec Sonnet et GPT-5 Mini.

Gemini Canvas et agents : la vraie carte d’I/O

Au-delà du modèle, les fuites laissent entrevoir une refonte plus large. Gemini Canvas, déjà disponible sur desktop, semble migrer vers mobile avec des fonctions agentiques renforcées : exécution de tâches multi-étapes, manipulation directe de documents Google Workspace, intégration avec l’écosystème Android et iOS. Cette évolution colle au virage agentique pris par tous les acteurs majeurs ces derniers mois.

Google a déjà retiré Vertex AI Studio au profit du Gemini Enterprise Agent Platform lors de Cloud Next 2026 en avril. L’I/O 2026 devrait acter cette transition côté grand public et développeurs, avec Gemini 3.2 comme socle.

Course aux prix, course aux capacités

La cadence de sortie des modèles s’accélère encore en 2026. DeepSeek V4 Pro, sorti la semaine dernière en open source, a fait baisser le coût d’inférence des agents IA de 17 fois avec sa précision FP4. Anthropic vient de signer un engagement de 200 milliards de dollars sur cinq ans avec Google Cloud pour faire tourner Claude sur les TPU. OpenAI multiplie les sorties pour défendre son leadership grand public avec GPT-5.5 Instant et GPT-Realtime-2.

Dans ce contexte, Google joue sur la verticale Android et la distribution mobile pour reprendre l’avantage. Gemini est déjà préinstallé sur des centaines de millions de Pixel et de Samsung Galaxy. La version 3.2 Flash pourrait devenir, par défaut, le modèle agentique le plus utilisé au monde, simplement parce qu’il sera le moins cher et le plus disponible. Un argument structurel que ni Anthropic ni OpenAI ne peuvent répliquer sans accord opérateur lourd.

Ce qu’on saura le 19 mai

Les questions ouvertes pour Google I/O sont précises. Quels benchmarks officiels Google va-t-il publier pour Gemini 3.2 Flash, et comment va-t-il les comparer à Claude Opus 4.7 et GPT-5.5 ? Une version Pro 3.2 va-t-elle suivre, ou Google va-t-il garder 3.1 Pro pour quelques mois ? Quelle place pour les agents Gemini dans Android 16 et Workspace ? Et surtout, combien de tokens de contexte pour le Flash 3.2, sachant que la concurrence pousse vers le million de tokens.

Réponses dans dix jours, sauf nouvelle fuite d’ici là.

Une apparition dans l’API avant l’annonce officielle

Un Flash positionné comme alternative low-cost à Gemini 3.1 Pro

Gemini Canvas et agents : la vraie carte d’I/O

Course aux prix, course aux capacités

Ce qu’on saura le 19 mai

À lire aussi

Le Canada débloque 62,7 millions de dollars pour muscler son industrie IA et robotique à Hanovre

La responsable robotique d’OpenAI démissionne après le deal militaire avec le Pentagone

AgiBot débarque en Europe : l’Expédition A3 lance l’offensive des robots humanoïdes chinois dans les hôtels et cinémas