ข่าว Gate News เมื่อวันที่ 10 เมษายน แพลตฟอร์มการประเมิน AI ระดับโลกที่น่าเชื่อถือในวันนี้ LMArena (แพลตฟอร์มประเมินโมเดล AI ที่มีผู้ใช้หลายล้านรายเข้าร่วมการทดสอบแบบปกปิด) อัปเดตตารางอันดับเฉพาะทาง Code Arena โดย GLM-5.1 ขึ้นเป็นอันดับหนึ่งของโมเดลโอเพนซอร์สอันดับที่หนึ่งทั่วโลก และอยู่ในอันดับสามของโมเดลทั่วโลก
GLM-5.1 ไม่เพียงสืบทอดความสามารถการเข้ารหัสแบบโอเพนซอร์ส SOTA จากโมเดลเจเนอเรชันก่อนหน้าเท่านั้น แต่ยังทำลายขีดจำกัดในงานระยะยาว (Long-Horizon Task) โดยทำให้สำเร็จดังนี้: สร้างเดสก์ท็อป Linux จากศูนย์ภายใน 8 ชั่วโมง; การวนซ้ำ 655 ครั้งเพื่อทำลายคอขวดของการปรับแต่งฐานข้อมูลเวกเตอร์; การเรียกใช้เครื่องมือ 1000 รอบเพื่อปรับแต่งให้เหมาะกับภาระการทำงานของโมเดลแมชชีนเลิร์นนิงจริง
ที่น่าสังเกตคือ ภายใต้มาตรฐานการประเมินเดียวกันในตาราง METR นั้น GLM-5.1 เป็นโมเดลโอเพนซอร์สเพียงรุ่นเดียวที่ทำงานต่อเนื่องระดับ 8 ชั่วโมงได้ และเป็นหนึ่งในไม่กี่รุ่นทั่วโลกที่มีความสามารถนี้ นอกเหนือจาก Claude Opus 4.6