Xiaomi dégaine MiMo V2.5 Pro, un modèle multimodal qui vise Claude Opus 4.6 et GPT-5.4

Xiaomi a dévoilé le 22 avril 2026 sa nouvelle famille MiMo V2.5 et V2.5 Pro, un duo de modèles multimodaux qui voient, entendent et agissent. Le constructeur chinois revendique des scores au niveau de Claude Opus 4.6 et GPT-5.4 sur la plupart des benchmarks de code, avec un coût en jetons nettement inférieur.

C’est la troisième salve de Xiaomi en cinq mois. Après MiMo V2 Flash en décembre 2025, la trilogie V2 Pro/Omni/TTS en mars, voici la série V2.5. Cette fois, la nouveauté tient en une phrase : vision native, audio, vidéo et code fusionnés dans un même modèle, contre des versions séparées auparavant.

Deux modèles pour deux usages

MiMo V2.5 Pro joue les poids lourds. Xiaomi annonce qu’il peut « accomplir de façon autonome des tâches professionnelles impliquant plus de 1 000 appels d’outils, un travail qui prendrait des jours à un humain ». Tarif affiché : 1 dollar par million de jetons en entrée et 3 dollars en sortie, avec une vitesse de 60 à 80 jetons par seconde.

MiMo V2.5 cible le quotidien. Plus rapide (100 à 150 jetons par seconde), moins cher (0,40 dollar en entrée, 2 dollars en sortie), il embarque l’image, l’audio et la vidéo que la version Pro laisse de côté. Les deux variantes partagent une fenêtre de contexte de 1 million de jetons, soit environ 750 000 mots dans une même conversation.

SWE-bench Pro à 57,2 % : Xiaomi joue dans la cour des grands

Le chiffre qui frappe vient de SWE-bench Pro, ce benchmark où les modèles corrigent de vrais bugs dans des bases de code de startups. MiMo V2.5 Pro résout 57,2 % des tâches. La moyenne du marché plafonne à 25 %. Sur τ3-bench et ClawEval, l’écart avec Claude Opus 4.6 et GPT-5.4 se compte en quelques points seulement. Xiaomi positionne explicitement V2.5 Pro comme backend direct pour les outils Claude Code, OpenCode et Kilo.

Le point faible reste Humanity’s Last Exam, un test de niveau doctorat qui couvre des dizaines de disciplines. MiMo y obtient 48 % contre 58,7 % pour GPT-5.4, soit un déficit de dix points difficile à effacer sur le raisonnement abstrait.

L’efficacité en jetons, vrai argument commercial

Là où Xiaomi marque des points, c’est sur la sobriété. La firme affirme que MiMo V2.5 Pro utilise 42 % de jetons en moins que Kimi K2.6 à score équivalent, et que MiMo V2.5 consomme presque deux fois moins de jetons que Muse Spark pour des résultats similaires. Pour un développeur qui traite des milliers de requêtes par jour, la différence se lit directement sur la facture mensuelle.

Sur les tâches multimodales, MiMo V2.5 affiche des scores au niveau de GPT-5.4 et Gemini 3.1 Pro, en se rapprochant d’Opus 4.6. Concrètement, vous pouvez envoyer une photo du contenu de votre frigo et demander des recettes, uploader un tutoriel vidéo pour obtenir un résumé étape par étape, ou enregistrer une réunion pour extraire les actions à suivre, le tout sans jongler avec trois services différents.

L’open source en embuscade

Xiaomi a annoncé que la série V2.5 sera bientôt publiée en open source. Les modèles sont déjà accessibles via l’API MiMo et en bêta publique. Cette stratégie prolonge celle de Qwen, DeepSeek ou Kimi : pression sur les prix, communauté d’utilisateurs et traction industrielle.

Le budget suit. Lei Jun, PDG de Xiaomi, avait annoncé en mars au moins 8,7 milliards de dollars d’investissement en IA sur les trois prochaines années. Selon Digital Applied, les modèles Xiaomi représentaient début avril environ 21 % du trafic chinois d’IA générative. Le rythme des sorties confirme que le budget est déjà en mouvement.

Ce que ça change

MiMo V2.5 Pro ne tue pas GPT-5.4 ni Claude Opus 4.6, mais il réduit l’écart sur le code et l’agent et creuse celui du prix. Pour les équipes tech qui déploient des agents à grande échelle, avoir un modèle chinois open source capable de rivaliser avec les frontières américaines sur les tâches de développement change la donne. La prochaine étape sera l’open-weight : si Xiaomi publie bien les poids, MiMo V2.5 pourrait devenir un standard du code agent en dehors de la Silicon Valley.

Sources : Decrypt, MarkTechPost, page officielle MiMo V2.5 Pro.

Deux modèles pour deux usages

SWE-bench Pro à 57,2 % : Xiaomi joue dans la cour des grands

L’efficacité en jetons, vrai argument commercial

L’open source en embuscade

Ce que ça change

À lire aussi

Forum Zhongguancun 2026 : des robots humanoïdes jouent du piano et accueillent 1 000 délégués à Beijing

Humanoïdes : la Chine livre, les États-Unis lèvent, l’écart se creuse selon CNBC

Claude Mythos : Anthropic dévoile le modèle IA le plus puissant jamais créé, mais refuse de le rendre public