GLM-5.2
Zhipu AI · Lanzado 13 de junio de 2026
Lo que realmente es
Durante años, ejecutar AI frontera localmente significaba aceptar un compromiso. GLM-5.2 es el primer modelo abierto donde ese compromiso empieza a sentirse opcional.
La evidencia viene de dos direcciones. Design Arena colocó a GLM-5.2 en #1 con Elo 1360. AkitaOnRails lo puntuó 87/100 (Tier A), desde 46/100 de GLM-5.1 — el mayor salto de versión en la historia del benchmark.
Con 744B parámetros totales (~40B activos), es más compacto que DeepSeek V4 (1,6T/49B activos) con benchmarks verificados más fuertes. Con cuantización dinámica 2-bit cabe en ~241GB — alcanzable para Mac Studios de 256GB o workstations dual-GPU.
La licencia MIT hace que la economía funcione. Sin límites regionales, sin restricciones. Inteligencia de coding de frontera que nunca sale de su red.
Puntos fuertes
- Inteligencia de coding frontera propia: Design Arena #1, SWE-bench Pro 62,1%, Terminal-Bench 82,7. Validación independiente. Ejecute en su infraestructura.
- Más compacto de lo esperado: 744B/~40B activos — más pequeño que DeepSeek V4 (1,6T) con benchmarks más fuertes. ~241GB con cuantización dinámica 2-bit.
- Contexto 1M para ingeniería real: Entrenado para escenarios de agentes de código. IndexShare reduce FLOPs 2,9× a 1M de contexto.
- Licencia MIT sin condiciones: Sin límites regionales ni requisitos de atribución.
- Dos modos de razonamiento: High para tareas rutinarias, Max para debugging complejo.
-
Design Arena — #1 (Elo 1360) Primer modelo abierto en liderar. Validación independiente de la comunidad.
-
SWE-bench Pro — 62,1% SOTA open-weight. Supera GPT-5.5 (58,6%). Subsets Verified ~78%+.
-
Arquitectura — 744B MoE / ~40B activos Más compacto que DeepSeek V4 (1,6T). ~241GB con cuantización dinámica 2-bit.
-
AkitaOnRails — 87/100 Tier A +41 puntos desde GLM-5.1 — mayor salto intra-familia jamás registrado.
Limitaciones honestas
- No es modelo de portátil: ~241GB mínimo. Necesita hardware serio.
- Sin visión nativa: Solo texto y código.
- Más lento que modelos ligeros: Latencia noticeable vs Qwen 3.6 27B o Gemma 4.
- Ecosistema madurando: Documentación en inglés menos pulida que el ecosistema chino.
El Veredicto: Este es el modelo de AI local que cambia la conversación. Design Arena #1. AkitaOnRails Tier A. SWE-bench Pro SOTA para pesos abiertos. Todo bajo MIT, todo descargable desde Hugging Face. El precio es honesto: necesita hardware serio. Pero para equipos con la infraestructura, es inteligencia de coding de frontera que nunca sale de su red.