searchresults
liveNews.Today
05:21

DeepSeek V4 จุดชนวนการถกเถียงในสหรัฐฯ: Think Tank ตั้งคำถามการใช้ชิป ขณะที่ซีอีโอ Replit ปกป้องนวัตกรรมแบบเปิด

ข้อความข่าวเกต ประจำวันที่ 24 เมษายน — ได้เกิดการถกเถียงขึ้นในสหรัฐอเมริกาเกี่ยวกับความสามารถทางเทคโนโลยีและการปฏิบัติตามกฎระเบียบของ DeepSeek V4 Chris McGuire สมาชิกอาวุโสของสภาความสัมพันธ์ต่างประเทศ (CFR) และอดีตเจ้าหน้าที่ของคณะมนตรีความมั่นคงแห่งชาติทำเนียบขาวและกระทรวงกลาโหม ได้เผยแพร่วิเคราะห์ว่า
liveNews.More
04:49

DeepSeek V4 ทำคะแนนสมบูรณ์แบบบน Putnam-2025 เสมอกับ Axiom ในการให้เหตุผลทางคณิตศาสตร์แบบเป็นทางการ

ข้อความจาก Gate News วันที่ 24 เมษายน — DeepSeek V4 ได้เผยแพร่ผลการประเมินการให้เหตุผลทางคณิตศาสตร์อย่างเป็นทางการ โดยทำคะแนนสมบูรณ์แบบ 120/120 บน Putnam-2025 เสมอกับ Axiom สำหรับอันดับที่หนึ่ง ในโหมดปฏิบัติการที่ใช้ LeanExplore และการสุ่มแบบมีข้อจำกัด V4-Flash-Max ได้คะแนน 81.00 ใน
liveNews.More
03:21

ข้อมูลการฝึกของ DeepSeek V4 เพิ่มเป็นสองเท่าเป็น 33T กระตุ้นความไม่เสถียรที่ทำให้การปล่อยล่าช้า

ข้อความ Gate News, 24 เมษายน — รายงานทางเทคนิคของ DeepSeek V4 เปิดเผยว่า V4-Flash และ V4-Pro ถูกพรีเทรนบนโทเค็น 32T และ 33T ตามลำดับ ซึ่งเพิ่มเป็นสองเท่าของประมาณ 15T โทเค็นที่ใช้สำหรับ V3 รายงานยอมรับว่าพบ "ความท้าทายด้านความไม่เสถียรอย่างมีนัยสำคัญ" ระหว่างการฝึก โดยการสูญเสียมีการพุ่งขึ้นซ้ำแล้วซ้ำเล่าเนื่องจากความผิดปกติในชั้น Mixture-of-Experts MoE; กลไกการเราท์ติ้งเองยิ่งเพิ่มความรุนแรงของความผิดปกติเหล่านี้ และการย้อนกลับอย่างง่ายไม่สามารถแก้ไขปัญหาได้
liveNews.More
03:04

DeepSeek เปิดตัวซีรีส์โมเดลโอเพนซอร์ส V4 ด้วยพารามิเตอร์ 1.6T และใบอนุญาต MIT

ข่าวประตูเมือง (Gate News) วันที่ 24 เมษายน — DeepSeek ได้เปิดตัวซีรีส์โมเดลโอเพนซอร์ส V4 ภายใต้ใบอนุญาต MIT โดยน้ำหนัก (weights) พร้อมใช้งานแล้วบน Hugging Face และ ModelScope ซีรีส์นี้ประกอบด้วยโมเดล (MoE) แบบ mixture-of-experts จำนวน 2 รุ่น ได้แก่ V4-Pro มีพารามิเตอร์รวม 1.6 ล้านล้านตัว และเปิดใช้งาน 49 พันล้านตัวต่อ
liveNews.More
09:45

DeepSeek เปิดซอร์ส TileKernels ไขลบรารีเคอร์เนล GPU สำหรับการฝึกและการอนุมานของโมเดลขนาดใหญ่

ข้อความข่าวจาก Gate วันที่ 23 เมษายน — DeepSeek ได้เปิดซอร์ส TileKernels ภายใต้สัญญาอนุญาต MIT ซึ่งเป็นไลบรารีเคอร์เนลสำหรับ GPU ที่เขียนด้วย TileLang สำหรับการฝึกและการอนุมานของโมเดลภาษาขนาดใหญ่ TileLang เป็นภาษาเฉพาะทางที่ทีม tile-ai พัฒนาขึ้น เพื่อใช้ในการแสดงเคอร์เนล GPU ประสิทธิภาพสูงใน
liveNews.More
20:02

DeepSeek 估值飙升至 $20 十亿美元以上;腾讯与阿里巴巴权衡投资

DeepSeek 寻求 >$20B 作为腾讯/阿里巴巴讨论投资;英伟达警告称,美国芯片优势可能会被华为削弱;随着 Vast Data 的 $1B 轮融资以及 OpenAI/Anthropic/xAI 的投资,AI 融资继续飙升。 DeepSeek 目标是在与腾讯和阿里巴巴的沟通中将估值推高至 $20 十亿美元以上,同时英伟达警告称,将 AI 模型转向华为芯片可能会削弱美国的领先地位。该报道还提到,全球 AI 融资出现激增,包括 Vast Data 的 $1 十亿美元轮融资,估值为 $30 十亿美元,以及对 OpenAI、Anthropic 和 xAI 的重大投资。
liveNews.More
14:05

Yifan Zhang เปิดเผย DeepSeek V4 แบบครบถ้วน: 1.6T พารามิเตอร์, 384 ผู้เชี่ยวชาญพร้อม 6 การทำงานต่อการเปิดใช้งาน

ข้อความจาก Gate News วันที่ 22 เมษายน — นักศึกษาปริญญาเอกจากมหาวิทยาลัยพรินซ์ตันอย่าง Yifan Zhang เปิดเผยข้อมูลจำเพาะทางเทคนิคทั้งหมดของ DeepSeek V4 บน X หลังจากมีการนำเสนอแบบตัวอย่างเมื่อวันที่ 19 เมษายน โดย V4 มีพารามิเตอร์รวม 1.6 ล้านล้านตัว และมีรุ่นที่มีน้ำหนักเบาอย่าง V4-Lite ที่มีพารามิเตอร์ 285 พันล้านตัว โมเดลใช้กลไกความสนใจ DSA2
liveNews.More
11:23

Tencent และ Alibaba เจรจาการลงทุนใน DeepSeek โดยมูลค่าประเมินเกิน $200 พันล้าน

ข่าวประตูเมือง: 22 เมษายน — Tencent และ Alibaba อยู่ระหว่างการเจรจาเพื่อเข้าลงทุนใน DeepSeek ตามรายงานของ The Information มูลค่าประเมินของ DeepSeek เกิน $200 พันล้าน.
02:21

เทสลาลงทะเบียนผู้ช่วยเสียง AI ในจีน ใช้โมเดลท้องถิ่นจาก DeepSeek และ Doubao

ข้อความ Gate News ประจำวันที่ 22 เมษายน — เทสลาได้ยื่นผู้ช่วยเสียงด้วยปัญญาประดิษฐ์แบบเจนเนอเรทีฟต่อหน่วยงานกำกับดูแลไซเบอร์สเปซของจีนเมื่อวันที่ 21 เมษายน ตามข้อมูลจากทางการเซี่ยงไฮ้ การยื่นคำขอนี้จำเป็นสำหรับบริการ AI ที่ให้บริการในจีน และถือเป็นหนึ่งในผลิตภัณฑ์และฟังก์ชัน AI จำนวน 158 รายที่เสร็จสิ้น
liveNews.More
01:46

ปริมาณการเรียกใช้โมเดล AI ของจีนลดลง 23.8% เทียบสัปดาห์ต่อสัปดาห์ ขณะที่สหรัฐฯ แซงเป็นครั้งแรกในรอบสองเดือน

ปริมาณการเรียกใช้โมเดล AI ทั่วโลกลดลงเหลือ 206 ล้านล้านโทเคนในสัปดาห์ที่แล้ว การเรียกใช้ของจีนลดลงเหลือ 444.1 ล้านล้าน ขณะที่ปริมาณของสหรัฐฯ เพิ่มขึ้นเป็น 490.8 ล้านล้าน ซึ่งแซงจีนเป็นครั้งแรกในรอบสองเดือน โมเดลชั้นนำ 4 จาก 9 รายการเป็นของจีน โดย DeepSeek V3.2 อยู่อันดับสองด้านจำนวนการเรียกใช้
liveNews.More