GLM-5.2

Zhipu AI · Lanzado 13 de junio de 2026

9.0 /10 Puntuación general

Lo que realmente es

Durante años, ejecutar AI frontera localmente significaba aceptar un compromiso. GLM-5.2 es el primer modelo abierto donde ese compromiso empieza a sentirse opcional.

La evidencia viene de dos direcciones. Design Arena colocó a GLM-5.2 en #1 con Elo 1360. AkitaOnRails lo puntuó 87/100 (Tier A), desde 46/100 de GLM-5.1 — el mayor salto de versión en la historia del benchmark.

Con 744B parámetros totales (~40B activos), es más compacto que DeepSeek V4 (1,6T/49B activos) con benchmarks verificados más fuertes. Con cuantización dinámica 2-bit cabe en ~241GB — alcanzable para Mac Studios de 256GB o workstations dual-GPU.

La licencia MIT hace que la economía funcione. Sin límites regionales, sin restricciones. Inteligencia de coding de frontera que nunca sale de su red.

Puntos fuertes

Inteligencia de coding frontera propia: Design Arena #1, SWE-bench Pro 62,1%, Terminal-Bench 82,7. Validación independiente. Ejecute en su infraestructura.
Más compacto de lo esperado: 744B/~40B activos — más pequeño que DeepSeek V4 (1,6T) con benchmarks más fuertes. ~241GB con cuantización dinámica 2-bit.
Contexto 1M para ingeniería real: Entrenado para escenarios de agentes de código. IndexShare reduce FLOPs 2,9× a 1M de contexto.
Licencia MIT sin condiciones: Sin límites regionales ni requisitos de atribución.
Dos modos de razonamiento: High para tareas rutinarias, Max para debugging complejo.

Resumen de Benchmarks

Design Arena — #1 (Elo 1360) Primer modelo abierto en liderar. Validación independiente de la comunidad.
SWE-bench Pro — 62,1% SOTA open-weight. Supera GPT-5.5 (58,6%). Subsets Verified ~78%+.
Arquitectura — 744B MoE / ~40B activos Más compacto que DeepSeek V4 (1,6T). ~241GB con cuantización dinámica 2-bit.
AkitaOnRails — 87/100 Tier A +41 puntos desde GLM-5.1 — mayor salto intra-familia jamás registrado.

Limitaciones honestas

No es modelo de portátil: ~241GB mínimo. Necesita hardware serio.
Sin visión nativa: Solo texto y código.
Más lento que modelos ligeros: Latencia noticeable vs Qwen 3.6 27B o Gemma 4.
Ecosistema madurando: Documentación en inglés menos pulida que el ecosistema chino.

El Veredicto: Este es el modelo de AI local que cambia la conversación. Design Arena #1. AkitaOnRails Tier A. SWE-bench Pro SOTA para pesos abiertos. Todo bajo MIT, todo descargable desde Hugging Face. El precio es honesto: necesita hardware serio. Pero para equipos con la infraestructura, es inteligencia de coding de frontera que nunca sale de su red.