Gate News 消息,4 月 10 日,今日全球權威 AI 評測平台 LMArena(百萬用戶參與盲測的 AI 模型評測平台)更新 Code Arena 專項榜單,GLM-5.1 登頂全球開源模型第一,位列全球模型第三。
GLM-5.1 不僅繼承了上一代模型的開源 SOTA 編碼能力,還在長程任務(Long-Horizon Task)上取得突破,實現了:8 小時從零建構 Linux 桌面;655 次迭代打破向量資料庫最佳化瓶頸;1000 輪工具呼叫最佳化真實機器學習模型負載。
值得一提的是,在 METR 榜單的相同評估標準下,GLM-5.1 是唯一達到 8 小時級持續工作的開源模型,也是全球範圍內除 Claude Opus 4.6 外少數具備這一能力的模型。