Industrie

GLM-5.2 : le modèle open source chinois de Z.ai dépasse GPT-5.5 sur le code pour un sixième du prix

Par La Rédaction ⏱ 3 min de lecture

La start-up chinoise Z.ai, ex-Zhipu AI, vient de publier GLM-5.2, un grand modèle de langage de 753 milliards de paramètres dont les poids sont librement téléchargeables. Sa particularité : il talonne, et parfois dépasse, les modèles propriétaires américains sur les tâches de programmation, tout en coûtant une fraction de leur prix d’accès.

Des benchmarks de code qui font mal à la concurrence

Le modèle a été pensé pour les tâches d’ingénierie et de codage dites « long-horizon », celles qui demandent à un agent de tenir une mission sur la durée. Les résultats parlent d’eux-mêmes. Sur SWE-bench Pro, GLM-5.2 marque 62,1 points contre 58,6 pour GPT-5.5. Sur FrontierSWE, qui mesure la capacité à mener une tâche jusqu’au bout, il atteint 74,4 %, devant GPT-5.5 (72,6 %) et au coude-à-coude avec Claude Opus 4.8 (75,1 %).

Il signe aussi 77,0 sur l’évaluation d’usage d’outils MCP-Atlas, encore devant GPT-5.5. Plus inattendu, GLM-5.2 prend la première place du classement de design crowdsourcé Design Arena, devançant même le très réputé Claude Fable 5. Sur le brutal Terminal-Bench 2.1, il reste juste derrière les deux ténors américains mais écrase nettement Gemini 3.1 Pro.

Un sixième du prix, et une licence MIT sans frontières

Côté tarif, l’écart est spectaculaire. L’API de GLM-5.2 facture 1,40 dollar par million de tokens en entrée et 4,40 dollars en sortie. En face, GPT-5.5 demande 30 dollars en sortie et Claude Opus 4.8 monte à 25 dollars. Pour un développeur qui enchaîne les requêtes, la facture peut être divisée par six ou plus.

Le vrai coup, toutefois, se joue sur la licence. Z.ai diffuse les poids sous une licence MIT sans restriction. Une entreprise peut télécharger le modèle, le modifier, le faire tourner sur sa propre infrastructure et le commercialiser sans redevance ni politique d’usage imposée. La documentation parle d’un accès « sans limites régionales ». Le contraste est frappant alors que Washington vient d’interdire l’accès des ressortissants étrangers à certains modèles d’Anthropic, poussant les entreprises soucieuses de souveraineté vers des alternatives ouvertes.

Pourquoi c’est important

Techniquement, GLM-5.2 introduit une optimisation baptisée IndexShare, qui réutilise le même indexeur sur quatre couches d’attention et réduit de près de 2,9 fois le calcul par token sur un contexte d’un million de tokens. Des modes de raisonnement sélectionnables permettent d’arbitrer entre puissance maximale et économie de tokens. L’accueil des développeurs a été immédiat : les éditeurs d’outils comme Cline et Kilo Code ont confirmé une intégration dès le premier jour. Au-delà de la performance, GLM-5.2 illustre la pression croissante des laboratoires chinois en open weights sur les marges des géants américains, accusés par une partie de la communauté de surfacturer leurs API.

🤖 Robots mentionnés dans cet article