DeepSeek V4 เผยแพร่ช่วงปลายเดือนเมษายน โดย Liang Wenfeng ยืนยันภายในว่า: หน้าต่าง token มูลค่าหนึ่งล้าน และทำงานบนชิป Huawei Ascend 950 PR แบบเต็มรูปแบบ

動區BlockTempo

ผู้ก่อตั้ง DeepSeek 梁文鋒 ได้ยืนยันด้วยตนเองในการสื่อสารภายในว่า โมเดลเรือธงรุ่นใหม่ V4 จะเปิดตัวอย่างเป็นทางการในช่วงปลายเดือนเมษายน ข้อมูลที่หลุดออกมาแสดงให้เห็นว่าจำนวนพารามิเตอร์รวมเข้าใกล้ 1 ล้านล้าน รองรับบริบทได้ราว 100 ล้าน tokens และยังจะรันได้อย่างเต็มรูปแบบบนชิปหัวเว่ย Ascend ทำให้ถูกมองว่าเป็นก้าวสำคัญของการที่จีนก้าวข้ามการพึ่งพา NVIDIA ของ AI
(ข้อมูลก่อนหน้า: DeepSeek V4 ปฏิเสธ NVIDIA ไปซื้อ Huawei! อาลีบาบา ByteDance Tencent แย่งกันซื้อชิป Ascend 950PR)
(ข้อมูลเพิ่มเติม: DeepSeek เปิดตัว “โหมดผู้เชี่ยวชาญ” และ “โหมดภาพ” V4 กำลังอุ่นเครื่องครั้งสุดท้ายก่อนเปิดตัวอย่างเป็นทางการ?)

ตามที่สื่อ Sina Finance อ้างคำบอกเล่าจากแหล่งข่าววงใน ผู้ก่อตั้ง DeepSeek 梁文鋒 ได้เปิดเผยแล้วว่าโมเดลภาษาขนาดใหญ่เรือธงรุ่นใหม่ DeepSeek V4 จะเปิดตัวอย่างเป็นทางการในช่วงปลายเดือนเมษายน แม้ทางการยังไม่ได้ประกาศวันเวลาที่แน่ชัด แต่ชุมชนผู้พัฒนาได้สัมผัสสัญญาณการอุ่นเครื่องมาก่อนแล้ว: เวอร์ชันตัวแปร V4-Lite กำลังอยู่ในการทดสอบตามจุดเชื่อมต่อ API ความเร็วการอนุมานเพิ่มขึ้น 30% เมื่อเทียบกับรุ่นก่อน และอัตราการเรียกคืนบริบท 128K tokens อยู่ที่ 94%

พารามิเตอร์ระดับหนึ่งหมื่นล้านล้าน และหน้าต่าง token ระดับล้าน

จากข้อมูลที่หลุดออกมาในตอนนี้ ซึ่งยังไม่ได้รับการยืนยันอย่างเป็นทางการ สถาปัตยกรรมของ V4 ยังคงใช้การออกแบบ Mixture-of-Experts(MoE) จำนวนพารามิเตอร์รวมอยู่ที่ราว 1 ล้านล้าน แต่สำหรับแต่ละ token แล้ว พารามิเตอร์ที่ถูกใช้งานจริงเพียงราว 37 พันล้าน ซึ่งทำให้ยังคงรักษา “สไตล์นักคำนวณที่ประณีต” ของ DeepSeek ไว้ในแง่ประสิทธิภาพด้านการคำนวณ

ส่วนของหน้าต่างบริบท: V4 ผ่านโมดูล Engram ใหม่ มีแนวโน้มว่าจะรองรับบริบทแบบอัลตร้ายาว 1 ล้าน tokens เพื่อสู้กับโมเดลชั้นนำในปัจจุบัน แนวคิดหลักของ Engram คือการค้นหาความจำแบบมีเงื่อนไข ทำให้โมเดลเข้าถึงความรู้ด้วยความซับซ้อน O(1) แทนที่จะขยายแบบเชิงเส้นตามความยาวของลำดับ

ในด้านความสามารถ ชุดการทดสอบเกณฑ์ที่หลุดออกมาระบุว่า HumanEval ทำได้ 90% และ SWE-bench Verified เกิน 80% หากข้อมูลเป็นความจริง ก็จะเข้าใกล้โมเดลเรือธงหลักในปัจจุบันเช่นกัน ด้านมัลติโหมด V4 รองรับการป้อนข้อมูลทั้งข้อความ รูปภาพ และวิดีโอโดยกำเนิด ส่วนราคาอยู่ที่ประมาณ $0.30/MTok(อินพุต) ต่อเนื่องกลยุทธ์ราคาต่ำของ DeepSeek

รันบนชิปของหัวเว่ยเท่านั้นอย่างเต็มรูปแบบ: สัญญาณทางภูมิรัฐศาสตร์ที่ใหญ่ที่สุด

นอกเหนือจากสเปกทางเทคนิค จุดที่ได้รับความสนใจจากภายนอกมากที่สุดของ V4 คือการเปลี่ยนผ่านด้านกลยุทธ์ฮาร์ดแวร์อย่างสิ้นเชิง: ทางการระบุว่าโมเดลทั้งตัวจะถูกรันบนชิปหัวเว่ย Ascend 950 PR อย่างสมบูรณ์ และไม่พึ่งพา GPU ของ NVIDIA

การตัดสินใจนี้มีผลกระทบมากกว่าตัว DeepSeek เอง อาลีบาบา ByteDance และ Tencent ได้สั่งซื้อชิปเจเนอเรชันถัดไปของหัวเว่ยเป็นจำนวนมากแล้ว หาก V4 สามารถยืนยันได้ว่า Ascend สามารถรองรับความต้องการในการฝึกและการอนุมานของโมเดลเรือธงระดับสูงได้ นี่จะเป็นตัวอย่างภาคปฏิบัติที่น่าเชื่อถือที่สุดในขณะนี้สำหรับห่วงโซ่อุตสาหกรรม AI ของจีนในการทำให้เทคโนโลยีชิปเป็นของตนเอง

มาตรการควบคุมการส่งออกของสหรัฐที่มีต่อ NVIDIA ในบริบทนี้ กลับอาจกลายเป็นตัวเร่งให้ระบบนิเวศอิสระของจีนเติบโตได้อย่างรวดเร็ว

news.article.disclaimer

btc.bar.articles

การฟ้องร้องระหว่างมัสก์กับซีอีโอของ OpenAI เริ่มพิจารณาคดีวันนี้! Elon Musk โกรธจัด: Altman คนหลอกลวง

คดีความระหว่าง มัสก์ และ OpenAI เริ่มพิจารณาที่แคลิฟอร์เนีย โดยมัสก์ได้ออกมาระดมโจมตีอย่างต่อเนื่องบนแพลตฟอร์ม X โดยกล่าวว่า Altman เป็น “คนหลอกลวง Altman” กล่าวหาว่า Altman และ บร็อคแมน ขโมยเงินขององค์กรการกุศล คดีนี้ถูกมองว่าเป็นการอิจฉาริษยาและกดทับการแข่งขัน OpenAI ระบุว่าจะเปิดเผยความจริงต่อหน้าศาล มูลค่าคดีสูงถึง 1,340 พันล้านดอลลาร์สหรัฐ แบ่งออกเป็นสองขั้นตอน ได้แก่ ความรับผิดชอบและการชดเชย คณะลูกขุนมีเพียงอำนาจให้คำแนะนำเท่านั้น และในที่สุดจะเป็นผู้พิพากษาที่เป็นผู้ตัดสิน

ChainNewsAbmedia1 ชั่วโมง ที่แล้ว

Gemini เปิดตัวการเทรดแบบ Agentic สำหรับการเทรดอัตโนมัติที่ขับเคลื่อนด้วย AI

แพลตฟอร์มแลกเปลี่ยนคริปโต Gemini ได้เปิดตัวการเทรดแบบ Agentic (Agentic Trading) ซึ่งถือเป็นครั้งแรกที่การแลกเปลี่ยนที่ได้รับการกำกับดูแลในสหรัฐฯ ได้ให้บริการการบูรณาการโดยตรงของเอเจนต์ AI สำหรับการเทรดอัตโนมัติ แพลตฟอร์มนี้ช่วยให้ผู้ใช้สามารถเชื่อมต่อ Claude, ChatGPT และโมเดล AI อื่นๆ เพื่อทำให้กลยุทธ์การเทรดเป็นอัตโนมัติได้ ตั้งแต่คำสั่งแบบง่ายๆ ไปจนถึง

CryptoFrontier1 ชั่วโมง ที่แล้ว

พนักงาน Google กว่า 580 คน เรียกร้องให้ซีอีโอยับยั้งสัญญา AI ของ Pentagon

ข่าวประตูเมือง วันที่ 27 เมษายน — พนักงานของ Google มากกว่า 580 คนได้ลงนามในจดหมายเปิดผนึกเรียกร้องให้ซีอีโอ ซุนดาร์ พิชัย (Sundar Pichai) ยับยั้งไม่ให้กระทรวงกลาโหมสหรัฐฯ (Pentagon) ใช้เทคโนโลยีปัญญาประดิษฐ์ของบริษัทสำหรับการใช้งานทางทหาร ผู้ลงนามซึ่งรวมถึงผู้บริหารระดับสูงมากกว่า 18 คน ตั้งแต่ผู้บริหารระดับสูงและผู้อำนวยการไปจนถึงรองประธานฝ่าย

GateNews2 ชั่วโมง ที่แล้ว

พ่อของ AlphaGo ทุ่มทุนรอบเมล็ดพันธุ์ 1,100 ล้านดอลลาร์สหรัฐ: ใหญ่ที่สุดในยุโรป มูลค่า 5.1 พันล้านดอลลาร์สหรัฐ

ตามที่สำนักงานกฎหมาย Cooley ออกข่าวประชาสัมพันธ์เมื่อวันที่ 27 เมษายน บริษัทวิจัย AI ในกรุงลอนดอน Ineffable Intelligence ได้ปิดการระดมทุนรอบเมล็ดพันธุ์มูลค่า 1.1 พันล้านดอลลาร์สหรัฐ ($1.1B) โดยมีมูลค่าหลังการลงทุน 5.1 พันล้านดอลลาร์สหรัฐ ($5.1B) นักลงทุนที่นำรอบคือ Sequoia Capital และ Lightspeed Venture Partners พร้อมด้วย Google, Nvidia, Index Ventures และอื่น ๆ ที่เข้าร่วมลงทุนด้วย นี่คือรอบเมล็ดพันธุ์ที่มีขนาดใหญ่ที่สุดในยุโรปตลอดหลายปีที่ผ่านมา และยังสะท้อนถึงกระแสการลงทุนรอบใหม่ของตลาดทุน AI ที่ “ไม่ได้เดิมพันแค่ LLM” เท่านั้น รอบเมล็ดพันธุ์ 1.1 พันล้านดอลลาร์สหรัฐ: ใหญ่ที่สุดในประวัติศาสตร์ยุโรป มูลค่า 5.1 พันล้านดอลลาร์สหรัฐ Ineffable Intelligence การระดมทุนครั้งนี้โดยตรงได้แซงหน้าเหนือกว่าในอดีต

ChainNewsAbmedia3 ชั่วโมง ที่แล้ว

จำนวนงานของ S&P 500 ลดลง 400,000 ขณะที่กระแส AI ปรับโฉมอเมริกาเชิงธุรกิจ

ข้อความ Gate News วันที่ 27 เมษายน — บริษัทในดัชนี S&P 500 มีการจ้างงานลดลงโดยประมาณ 400,000 ตำแหน่ง สู่ 28.1 ล้านตำแหน่งในปี 2026 ซึ่งถือเป็นการลดลงรายปีครั้งแรกนับตั้งแต่ปี 2016 หลังจากการเติบโตของงานอย่างต่อเนื่องมาเป็นเวลาแปดปีติดต่อกัน ตามรายงานของ The Kobeissi Letter บริษัทขนาดใหญ่อย่าง Amazon

GateNews3 ชั่วโมง ที่แล้ว

Consensys, Joseph Lubin บริจาค 30,000 ETH ให้กับ DeFi United

Consensys และ Joseph Lubin ผู้ร่วมก่อตั้ง Ethereum ได้ยืนยันว่าพวกเขาจะบริจาค 30,000 ETH ให้แก่ DeFi United ซึ่งเป็นความช่วยเหลือแบบประสานงานที่มุ่งจัดการกับความสูญเสียจากการถูกเอ็กซ์พลอยต์ของ Kelp DAO ตามประกาศในวันจันทร์ของ Aave นี่ถือเป็นหนึ่งในข้อเสนอที่ใหญ่ที่สุดในความพยายามที่ดำเนินอยู่ ซึ่งคงจะ

CryptoFrontier3 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น