Moonshot ouvre Kimi K2.7-Code, un modèle de programmation à mille milliards de paramètres qui consomme 30 % de raisonnement en moins

Moonshot AI continue de pousser le code open source vers le haut de gamme. La société chinoise vient de publier Kimi K2.7-Code, un modèle taillé pour la programmation agentique, dont les poids sont disponibles sur Hugging Face sous une licence MIT modifiée. Annonce clé : environ 30 % de jetons de raisonnement en moins que la version précédente.

Un modèle pensé pour les longues sessions de code

K2.7-Code ne vise pas la conversation générale. Il cible l’ingénierie logicielle sur de longues durées : planifier, éditer des fichiers, lancer des outils et déboguer sur de nombreuses étapes. Moonshot l’accompagne d’une plateforme de codage par abonnement, baptisée Kimi Code.

Sous le capot, c’est une architecture à mélange d’experts. Le modèle totalise mille milliards de paramètres mais n’en active que 32 milliards par jeton, en piochant 8 experts parmi 384. Sa fenêtre de contexte atteint 256 000 jetons, de quoi avaler de gros différentiels de code, des journaux d’exécution et des fichiers liés dans une même requête. Un encodeur visuel ajoute la prise en charge des images et des vidéos.

Des gains nets, mais des chiffres maison

Moonshot revendique des progrès sur six tests face à K2.6, GPT-5.5 et Claude Opus 4.8. Le bond le plus marquant concerne son propre Kimi Code Bench v2, qui passe de 50,9 à 62,0, soit une hausse de 21,8 %. Le modèle dépasse même Opus 4.8 sur le test MCP Mark Verified, avec 81,1 contre 76,4.

Une nuance s’impose. Tous ces résultats sont produits par l’éditeur lui-même, sans validation indépendante à ce stade. Les comparaisons ont aussi été menées dans des environnements différents selon les modèles. La prudence reste donc de mise tant que des classements externes ne confirment pas ces scores.

L’argument du coût, pas seulement de la qualité

La baisse de 30 % des jetons de raisonnement n’est pas qu’une histoire de sobriété. Ces jetons sont facturés comme des jetons de sortie chez la plupart des fournisseurs. Or un agent de code enchaîne des centaines, parfois des milliers d’étapes, et chaque planification ou vérification repaie ce coût. Réduit sur toute la durée d’une tâche, l’effet se cumule : moins cher, plus rapide, et davantage d’étapes avant de saturer le contexte.

Le tarif annoncé reste agressif face aux modèles fermés de pointe : 0,95 dollar par million de jetons en entrée et 4 dollars en sortie, contre 5 et 25 dollars pour Opus 4.8. Le revers : les poids pèsent environ 595 Go, ce qui réserve l’auto-hébergement à des serveurs costauds. Le mode raisonnement, lui, ne peut pas être désactivé. Pour les équipes qui veulent un modèle de code ouvert et bon marché, Kimi K2.7-Code s’installe néanmoins comme une option sérieuse.

Un modèle pensé pour les longues sessions de code

Des gains nets, mais des chiffres maison

L’argument du coût, pas seulement de la qualité

À lire aussi

HD Hyundai et Persona AI vont tester des robots soudeurs humanoïdes dans les chantiers navals

GITAI : ses robots autonomes assemblent une base lunaire, panneau solaire et tour de 5 mètres compris

Cursor dévoile Origin, l’hébergement de code pensé d’abord pour les agents IA et non pour les humains