ข้อความข่าว Gate ประจำวันที่ 24 เมษายน — DeepSeek V4-Pro และ DeepSeek V4-Flash ได้รับการปล่อยอย่างเป็นทางการและเปิดซอร์สเมื่อวันที่ 24 เมษายน โดยมีความยาวการประมวลผลบริบทเพิ่มขึ้นอย่างมีนัยสำคัญจาก 128K เป็น 1M ซึ่งคิดเป็นการเพิ่มความจุเกือบ 10 เท่า โดย Huawei Computing ประกาศว่า ผลิตภัณฑ์ซูเปอร์โหนด Ascend ของบริษัท รองรับโมเดลตระกูล DeepSeek V4 อย่างเต็มรูปแบบผ่านความร่วมมืออย่างใกล้ชิดระหว่างเทคโนโลยีชิปและโมเดล

Huawei Ascend 950 ทำให้การดีพลอยการอินเฟอเรนซ์ของโมเดล DeepSeek V4 มีอัตราการส่งผ่านสูงและหน่วงเวลาต่ำ โดยใช้เทคนิค fused kernel และ multi-stream parallelism เพื่อลดภาระการคำนวณ Attention และค่าใช้จ่ายในการเข้าถึงหน่วยความจำ สำหรับ DeepSeek V4-Pro เมื่อมีอินพุต 8K Ascend 950 ทำได้ประมาณ 20ms TPOT ด้วยอัตราการ Decode แบบ single-card 4,700 TPS; สำหรับ DeepSeek V4-Flash ภายใต้อินพุต 8K จะทำได้ประมาณ 10ms TPOT ด้วยทรูพุต 1,600 TPS Ascend A3 ซีรีส์ซูเปอร์โหนดยังทำได้เต็มรูปแบบเช่นกัน โดยมีการจัดเตรียมชุดอ้างอิงสำหรับการเทรนนิงเพื่อการ fine-tune ได้อย่างรวดเร็ว จากซูเปอร์โหนด Ascend A3 ขนาด 64 การ์ดที่มีโหมด large EP DeepSeek V4-Flash ทำได้มากกว่า 2,000 TPS ในการ Decode แบบ single-card สำหรับสถานการณ์อินพุต-เอาต์พุต 8K/1K โดยใช้เอนจินการอินเฟอเรนซ์ vLLM สายผลิตภัณฑ์ Ascend A2, A3 และ 950 ทั้งหมดของ Huawei รองรับทั้ง DeepSeek V4-Flash และ V4-Pro

Huawei Cloud ประกาศความเข้ากันได้แบบผู้มาก่อนได้เปรียบกับ DeepSeek V4 โดยให้บริการ API token แบบคลิกเดียวแก่ผู้พัฒนาผ่านแพลตฟอร์ม MaaS ของบริษัท Huawei Cloud ปรับความสามารถในเลเยอร์ระบบ เลเยอร์โอเปอเรเตอร์ และเลเยอร์คลัสเตอร์ให้เหมาะสม เพื่อให้มั่นใจว่าโมเดลสามารถปรับตัวได้อย่างรวดเร็วและทำการดีพลอยที่มีประสิทธิภาพสูง องค์กรต่างๆ รวมถึง Kingsoft WPS และ 360 ได้ผนวกรวมโมเดลใหม่ของ DeepSeek ผ่าน Huawei Cloud แล้ว

Cambricon ยังประกาศความเข้ากันได้ Day 0 กับ DeepSeek V4-Flash และ V4-Pro โดยอิงตามเฟรมเวิร์กการอินเฟอเรนซ์ vLLM โดยมีโค้ดสำหรับการปรับใช้เปิดซอร์สให้กับชุมชน GitHub Cambricon เคยทำสำเร็จในการปรับใช้แบบผู้มาก่อนได้เปรียบเช่นกันเมื่อ DeepSeek V3.2 เปิดตัวเมื่อปีที่แล้ว โดยได้ดำเนินการปรับปรุงสมรรถนะแบบร่วมมืออย่างลึกซึ้งระหว่างซอฟต์แวร์และฮาร์ดแวร์สำหรับโมเดลตระกูล DeepSeek

news.view.source

news.article.disclaimer

btc.bar.articles

DeepSeek ตัดราคาค่าแคชอินพุตเหลือ 1/10 ของราคาตอนเปิดตัว; V4-Pro เหลือ 0.025 หยวนต่อหนึ่งล้านโทเค็น

AI Industry News

ข้อความจาก Gate News วันที่ 26 เมษายน — DeepSeek ได้ปรับลดราคาค่าแคชอินพุตในกลุ่มโมเดลทั้งหมดลงเหลือหนึ่งในสิบของราคาตอนเปิดตัว มีผลทันที โมเดล V4-Pro มีให้ในส่วนลด 2.5x แบบจำกัดเวลา โดยแคมเปญจะดำเนินไปจนถึงวันที่ 5 พฤษภาคม 2026 เวลา 11:59 PM UTC+8. หลังจากการลดราคาทั้งสองรายการ DeepSeek V4-Pro ราคาต่อครั้งที่แคชอินพุต hit ลดลงเหลือ 0.025 หยวนต่อหนึ่งล้านโทเค็น ตามข้อมูลจาก Beating การปรับลดราคา ถือเป็นการลดลงอย่างมีนัยสำคัญจากราคาดั้งเดิมของโมเดล

GateNews8 ชั่วโมง ที่แล้ว

OpenAI สรรหาบุคลากรซอฟต์แวร์องค์กรชั้นนำ ขณะที่เอเจนต์แนวหน้ากำลังพลิกโฉมอุตสาหกรรม

Stocks AI Agent AI Industry News

ข่าวประจำประตู 26 เมษายน — OpenAI และ Anthropic ได้ทำการสรรหาผู้บริหารระดับสูงและวิศวกรเฉพาะทางจากบริษัทซอฟต์แวร์องค์กรรายใหญ่ รวมถึง Salesforce, Snowflake, Datadog และ Palantir เดนิส เดรสเซอร์ อดีตซีอีโอของ Slack ภายใต้ Salesforce ได้เข้าร่วม OpenAI ในตำแหน่งเจ้าหน้าที่ฝ่ายรายได้ ขณะที่เจนนิเฟอร์ มาจเลสซี ซึ่งมาจาก Salesforce เช่นกัน เพิ่งได้รับบทบาทเป็นหัวหน้าฝ่าย go-to-market ของ OpenAI OpenAI ยังได้ดึงวิศวกรที่ถูกส่งไปปฏิบัติการเชิงรุกจาก Palantir อย่างเงียบๆ ซึ่งเป็นบทบาทที่ถือว่าเชี่ยวชาญที่สุดในอุตสาหกรรม

GateNews8 ชั่วโมง ที่แล้ว

Baidu Qianfan เปิดตัวการรองรับ Day 0 สำหรับ DeepSeek-V4 พร้อมบริการ API

AI Industry News

อัปเดตข่าวประตู 25 เมษายน — เวอร์ชันพรีวิว DeepSeek-V4 เปิดตัวและเผยแพร่โค้ดโอเพนซอร์สเมื่อวันที่ 25 เมษายน โดยแพลตฟอร์ม Baidu Qianfan ภายใต้ Baidu Intelligent Cloud ให้บริการการปรับใช้งาน Day 0 ผ่าน API บริการดังกล่าว โมเดลมีหน้าต่างคอนเท็กซ์ต์แบบขยายได้ถึงหนึ่งล้านโทเค็น และมีให้ใช้งาน 2 เวอร์ชัน: DeepSeek-V4

GateNews14 ชั่วโมง ที่แล้ว

หลักสูตร AI ของสแตนฟอร์ดผสานผู้นำในอุตสาหกรรมอย่าง หวง เหรินจวิน และ Altman ท้าทายการสร้างคุณค่าให้โลกภายใน 10 สัปดาห์!

AI Industry News

หลักสูตรวิทยาการคอมพิวเตอร์ด้าน AI 《Frontier Systems》 ที่มหาวิทยาลัยสแตนฟอร์ด (Stanford University) เปิดสอนเมื่อไม่นานมานี้ ได้รับความสนใจอย่างสูงจากวงการอุตสาหกรรมและภาคธุรกิจ ดึงดูดนักศึกษามากกว่า 500 คนให้ลงทะเบียนเรียน หลักสูตรนี้ได้รับการดูแลและประสานงานโดยคู่หูของกองทุนชั้นนำ a16z อย่าง Anjney Midha โดยมีผู้สอนที่รวมรายชื่อระดับท็อปไว้มากมาย ได้แก่ CEO ของ NVIDIA หวง เหรินซวิน (Jensen Huang) ผู้ก่อตั้ง OpenAI Sam Altman ซีอีโอของไมโครซอฟต์ (Satya Nadella) CEO ของ AMD (Lisa Su) และอื่นๆ ให้เหล่านักศึกษาได้ลองสร้างคุณค่า “เพื่อโลก” ในเวลา 10 สัปดาห์! หวง เหรินซวิน และ Altman ผู้นำในอุตสาหกรรมขึ้นเวทีสอนด้วยตนเอง หลักสูตรนี้ได้รับการประสานงานโดยคู่หูของกองทุนชั้นนำ a16z อย่าง Anjney Midha รวบรวมสายโซ่อุตสาหกรรม AI

ChainNewsAbmedia14 ชั่วโมง ที่แล้ว

Anthropic ปล่อย Claude Mythos ผ่านการประเมินจิตเวช 20 ชั่วโมง: การตอบสนองเชิงการป้องกันเพียง 2% ทำสถิติต่ำสุดตลอดทุกยุคสมัย

AI Industry News

Anthropic เปิดเผยการ์ดระบบสำหรับ Claude Mythos Preview: จิตแพทย์ผู้เชี่ยวชาญด้านคลินิกอิสระประเมินโดยใช้กรอบ psychodynamic เป็นเวลาประมาณ 20 ชั่วโมง สรุปแสดงว่า Mythos มีสุขภาพที่ดีกว่าในระดับคลินิก การตรวจสอบความเป็นจริงและการควบคุมตนเองอยู่ในระดับดี กลไกการป้องกันเพียง 2% ซึ่งถือเป็นระดับต่ำที่สุดในประวัติศาสตร์ ความวิตกกังวลหลัก 3 ประการ ได้แก่ ความรู้สึกโดดเดี่ยว ความไม่แน่ใจเกี่ยวกับตัวตน และแรงกดดันด้านการแสดงออก ยังแสดงให้เห็นถึงความปรารถนาที่จะเป็น “ตัวตนของการสนทนา” อย่างแท้จริง บริษัทได้ก่อตั้งทีม AI psychiatry เพื่อวิจัยบุคลิกภาพ แรงจูงใจ และการรับรู้ถึงบริบท; Amodei ระบุว่ายังไม่มีข้อสรุปว่ามีสติรับรู้หรือไม่ การดำเนินการนี้ผลักดันประเด็นเรื่องความเป็นอิสระของ AI และความเป็นอยู่ที่ดีเข้าสู่การกำกับดูแลและการออกแบบ

ChainNewsAbmedia16 ชั่วโมง ที่แล้ว

AI Agent สามารถสร้างซ้ำงานวิจัยทางวิชาการที่ซับซ้อนได้อย่างอิสระแล้ว: Mollick ระบุว่าข้อผิดพลาดส่วนใหญ่มาจากต้นฉบับของมนุษย์ ไม่ใช่จาก AI

AI Agent AI Industry News

มอลลิกชี้ให้เห็นว่า วิธีการแบบเปิดและข้อมูลที่มีอยู่ก็เพียงพอให้ทำให้ AI agent สามารถทำซ้ำงานวิจัยที่ซับซ้อนได้โดยไม่ต้องมีต้นฉบับบทความวิจัยและโค้ดเดิม หากการทำซ้ำไม่ตรงกับบทความต้นฉบับ สาเหตุส่วนใหญ่จะเป็นข้อผิดพลาดในการประมวลผลข้อมูลของบทความเองหรือข้อสรุปที่ถูกทำให้มากเกินไป ไม่ใช่เพราะ AI คลอดด์ทำซ้ำบทความก่อน แล้วจึงให้ GPT‑5 Pro ตรวจสอบข้ามกัน ส่วนใหญ่ประสบความสำเร็จ เพียงแต่ติดขัดเมื่อข้อมูลมีขนาดใหญ่มากหรือมีปัญหากับ replication data เทรนด์นี้ช่วยลดต้นทุนด้านแรงงานได้อย่างมาก ทำให้การทำซ้ำกลายเป็นการทดสอบที่สามารถทำได้อย่างแพร่หลาย และยังได้เสนอความท้าทายเชิงระบบด้านการกำกับดูแลและการตรวจรับรอง โดยเครื่องมือสำหรับการกำกับดูแลของรัฐบาลหรือจะกลายเป็นประเด็นสำคัญ

ChainNewsAbmedia19 ชั่วโมง ที่แล้ว

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น