ครบรอบหนึ่งปีของการเปิดตัว DeepSeek-R1 เปิดตัวโมเดลใหม่「MODEL1」

GateNews
source.from

BlockBeats ข่าวสาร เมื่อวันที่ 21 มกราคม ตามรายงานของ Quantum Bit ได้เปิดเผยโมเดลใหม่「MODEL1」ในโอกาสครบรอบหนึ่งปีของ DeepSeek-R1 โดย DeepSeek ได้อัปเดตโค้ด FlashMLA บน GitHub ซึ่งมีการกล่าวถึง MODEL1 ในไฟล์ 114 ไฟล์ จำนวน 28 จุด ซึ่งปรากฏเป็นโมเดลที่แตกต่างจาก V32 ซึ่งเป็น DeepSeek-V3.2 ที่ทราบกันดีว่า V32 คือ DeepSeek-V3.2 ส่วน MODEL1 อาจเป็นโครงสร้างใหม่ ความแตกต่างในโค้ดชัดเจนในด้านการจัดวาง KV cache การจัดการความหายาก และการถอดรหัส FP8 ซึ่งมีหลายจุดที่แตกต่างกันในด้านการปรับปรุงหน่วยความจำ

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น