Le laboratoire d’IA chinois Z.ai vient de bouleverser le paysage des modèles linguistiques open-source avec la sortie de GLM-5.2, disponible en accès libre depuis le 16 juin sous licence MIT. Ce modèle de 753 milliards de paramètres, pesant 1,51 To, représente une avancée majeure dans le domaine des grands modèles de langage (LLM) à poids ouverts.
Avec une fenêtre de contexte étendue à 1 million de tokens - contre seulement 200 000 pour sa version précédente GLM-5.1 - ce nouveau venu se positionne comme un sérieux concurrent des modèles propriétaires. Les premiers benchmarks sont éloquents : GLM-5.2 occupe désormais la première place de l’Intelligence Index v4.1 d’Artificial Analysis, surpassant des modèles réputés comme MiniMax-M3 et DeepSeek V4 Pro.
Cependant, cette performance a un prix. GLM-5.2 se montre particulièrement gourmand en tokens de sortie, nécessitant 43 000 tokens par tâche contre seulement 26 000 pour GLM-5.1. Une particularité qui pourrait influencer son coût d’utilisation, actuellement estimé à 4,40 dollars par million de tokens en sortie sur certaines plateformes.
L’une des surprises vient de ses performances exceptionnelles dans le développement web, où il se classe deuxième sur le Code Arena WebDev leaderboard, juste derrière Claude Fable 5. Une performance remarquable pour un modèle ne traitant que du texte, sans capacité de vision.
Les tests pratiques révèlent des résultats contrastés. Si GLM-5.2 excelle dans la génération d’images vectorielles animées comme un pélican à vélo, ses performances chutent pour des sujets plus complexes comme un opossum de Virginie sur un trottinette électrique. Une performance en demi-teinte qui rappelle que la maîtrise des détails reste un défi pour ces modèles open-source.
Avec GLM-5.2, Z.ai confirme sa position de leader dans le domaine des modèles open-source, tout en soulevant des questions sur l’équilibre entre performance et coût d’utilisation. Une avancée qui pourrait bien redéfinir les standards de l’industrie.