Noticias de Gate News. 10 de abril. Hoy, la plataforma global de evaluación autorizada de IA LMArena (plataforma de evaluación de modelos de IA basada en pruebas a ciegas con participación de millones de usuarios) actualizó el ranking especializado Code Arena. GLM-5.1 ocupa el primer lugar entre los modelos de código abierto a nivel global y el tercero a nivel mundial.
GLM-5.1 no solo hereda las capacidades de codificación SOTA de código abierto de la generación anterior, sino que también logra un avance en tareas de largo alcance (Long-Horizon Task), consiguiendo: construir un escritorio Linux desde cero en 8 horas; 655 iteraciones para superar el cuello de botella de optimización de las bases de datos vectoriales; y 1000 rondas de optimización de llamadas a herramientas para ajustarse a cargas reales de modelos de aprendizaje automático.
Cabe destacar que, bajo los mismos criterios de evaluación del ranking METR, GLM-5.1 es el único modelo de código abierto que alcanza un trabajo continuo de nivel de 8 horas, y es, a nivel global, uno de los pocos modelos que cuentan con esta capacidad, además de Claude Opus 4.6.