Le timing est cruel : la Chine dévoile GLM-5.2, un modèle gratuit qui rivalise avec Claude Opus 4.8 et GPT-5.5
Dévoilé à la mi-juin 2026, GLM-5.2 talonne Claude Opus 4.8 et fait jeu égal avec, voire dépasse, GPT-5.5 sur certains benchmarks de code. Des performances qui propulsent ce modèle chinois sous les projecteurs, d’autant qu’il dispose d’un autre atout majeur : une licence ouverte, gratuite et auto-hébergeable.
C’est le tout dernier modèle de Z.ai, ex-Zhipu AI. La start-up chinoise vient de le publier, avec un timing difficilement plus opportun pour capter l’attention de l’écosystème IA.
Alors que Washington a interdit l’accès à Claude Fable 5 et Mythos aux utilisateurs étrangers, poussant Anthropic à retirer ses deux modèles, l’émergence d’une IA très performante, téléchargeable et exécutable localement, prend une tout autre dimension.
En temps normal, les performances techniques de GLM-5.2 auraient suffi à attirer l’attention. Mais sa structure à poids ouverts (open weights) intervient à un moment où la dépendance aux IA fermées américaines est de plus en plus remise en question, au point de propulser le modèle en tête des discussions sur Hacker News le 17 juin 2026.
Une mémoire de travail multipliée par cinq
Sorti le 13 juin, le modèle affiche 744 milliards de paramètres (dont environ 40 milliards actifs) et cible les tâches longues : construire un logiciel de bout en bout, explorer un dépôt complet ou maintenir un projet sur plusieurs heures.
Sa fenêtre de contexte atteint un million de tokens, contre 200 000 pour GLM-5.1. Deux modes de raisonnement, « Max » et « High », permettent d’arbitrer entre performance maximale et consommation de ressources.
Sur les benchmarks, GLM-5.2 s’impose comme l’un des modèles ouverts les plus performants à ce jour. Le cabinet Artificial Analysis lui attribue un score de 51 sur son indice d’intelligence, devant MiniMax-M3 et DeepSeek V4 Pro (44 chacun).
Sur FrontierSWE, un test conçu pour les projets techniques de long horizon, il atteint 74,4%, juste derrière Claude Opus 4.8 (75,1%) et devant GPT-5.5 (72,6%). Même dynamique sur SWE-bench Pro. Sur l’évaluation GDPval-AA v2, qui mesure la performance agentique en conditions réelles, il se hisse au niveau de GPT-5.5 en mode de raisonnement avancé.
Une licence qui pèse autant que les scores
Sur la partie « libre », Z.ai joue la carte maximale : GLM-5.2 est publié sous licence MIT et téléchargeable sur Hugging Face. N’importe quelle entreprise peut récupérer le modèle, le modifier, le commercialiser et le faire tourner sur ses propres serveurs sans verser de royalties à Z.ai.
À condition évidemment d’avoir les machines pour faire tourner un modèle de 744 milliards de paramètres, ce qui exclut d’emblée la plupart des particuliers et des petites structures.
Pour qui n’a pas cette capacité de calcul, l’accès passe par une API. Et là, l’usage reste payant : 1,40 dollar par million de tokens en entrée, 4,40 dollars en sortie. L’écart avec les modèles fermés demeure net : GPT-5.5 facture 5 et 30 dollars pour les mêmes volumes.
Une nuance importante concerne le coût réel à l’usage. GLM-5.2 se montre nettement plus bavard que ses concurrents directs en phase de raisonnement, avec environ 43 000 tokens générés par tâche, contre 26 000 pour GLM-5.1 et 24 000 pour MiniMax-M3.
Le coût par tâche accomplie peut donc dépasser celui de certains modèles ouverts concurrents, même si l’avantage face aux modèles fermés américains reste significatif.
Tout le monde n'a pas les moyens de payer pour l'information. C'est pourquoi nous maintenons notre journalisme ouvert à tous.
Source : Numerama — voir l'article d'origine ↗