ผู้รับผิดชอบโมเดลขนาดใหญ่ของ Xiaomi: การแข่งขันด้าน AI กำลังเข้าสู่ยุคของ Agent และการพัฒนาตัวเองคือเหตุการณ์สำคัญสู่ AGI

AI自進化

ทีมผู้นำโมเดลขนาดใหญ่ของ Xiaomi โดย Luo Fuli ได้ให้สัมภาษณ์เชิงลึกบนแพลตฟอร์ม Bilibili เมื่อวันที่ 24 เมษายน (หมายเลขวิดีโอ: BV1iVoVBgERD) โดยมีระยะเวลาการสัมภาษณ์ 3.5 ชั่วโมง และเป็นครั้งแรกที่เธอในฐานะผู้อำนวยการด้านเทคโนโลยีได้อธิบายมุมมองด้านเทคโนโลยีอย่างเป็นระบบต่อสาธารณะ Luo Fuli กล่าวว่า การแข่งขันของสายงานโมเดลขนาดใหญ่ได้เปลี่ยนจากยุค Chat ไปสู่ยุค Agent และชี้ว่า “การวิวัฒนาการด้วยตนเอง” จะเป็นเหตุการณ์สำคัญของ AGI ในปีหน้า

จากยุค Chat สู่ยุค Agent: การตัดสินเชิงเทคนิคหลัก

小米大模型團隊負責人羅福莉訪談

(ที่มา:Bilibili)

จากคำกล่าวของ Luo Fuli ในการสัมภาษณ์บน Bilibili เธอระบุว่า จุดศูนย์กลางของการแข่งขันโมเดลขนาดใหญ่ในปี 2026 จะเปลี่ยนจากคุณภาพการสนทนาแบบทั่วไป ไปสู่ความสามารถในการดำเนินการอย่างต่อเนื่องและเป็นอิสระในงานที่ซับซ้อน เธอระบุในการสัมภาษณ์ว่า ขณะนี้โมเดลชั้นนำสามารถทำการปรับให้เหมาะสมด้วยตนเองในงานเฉพาะ และดำเนินการอย่างเสถียรเป็นเวลา 2 ถึง 3 วัน โดยไม่จำเป็นต้องมีการแทรกแซงจากมนุษย์ เธอยังเน้นในการสัมภาษณ์ว่า ความก้าวหน้าของความสามารถ “การวิวัฒนาการด้วยตนเอง” หมายถึงระบบ AI เริ่มมีความสามารถในการปรับแก้ด้วยตนเอง และได้ยกตัวอย่างเส้นทางด้านเทคนิคของ Anthropic รวมถึงตัวแปรทางเทคนิคอย่าง Claude Opus 4.6 ที่มีผลต่อระบบนิเวศ AI ทั้งหมด

การปรับสัดส่วนพลังประมวลผลของ Xiaomi และการประเมินอคติรุ่น Pre-train

จากสิ่งที่ Luo Fuli เปิดเผยในการสัมภาษณ์ Xiaomi ได้มีการปรับเปลี่ยนครั้งสำคัญแล้วในกลยุทธ์การจัดสรรพลังประมวลผล เธออธิบายว่า โดยปกติอุตสาหกรรมใช้สัดส่วนพลังประมวลผล Pre-train:Post-train:Inference = 3:5:1 แต่กลยุทธ์ปัจจุบันของ Xiaomi ได้ปรับเป็น 3:1:1 โดยบีบอัดสัดส่วนการฝึกหลังอย่างมาก พร้อมเพิ่มการลงทุนทรัพยากรในช่วงการอนุมานไปพร้อมกัน

เธออธิบายในระหว่างการสัมภาษณ์ว่า การเปลี่ยนแปลงนี้เกิดจากความสุกงอมของกลยุทธ์ Agent RL Scaling ทำให้ไม่จำเป็นต้องกองพลังประมวลผลจำนวนมากสำหรับการฝึกหลังอีกต่อไป และการเพิ่มทรัพยากรฝั่งการอนุมานสะท้อนถึงความต้องการความสามารถในการตอบสนองแบบทันทีในสถานการณ์ที่ Agent นำไปใช้งานได้จริง

สำหรับปัญหาความต่างของรุ่น Pre-train ของโมเดลขนาดใหญ่ในประเทศ Luo Fuli ระบุว่า ช่องว่างดังกล่าวจากเดิม 3 ปี ได้ถูกย่อให้เหลือเพียงไม่กี่เดือนแล้วในปัจจุบัน จุดเน้นของกลยุทธ์กำลังย้ายไปสู่ Agent RL Scaling โดยตรง ประวัติการทำงานของ Luo Fuli ครอบคลุมสถาบันวิจัย DAMO ของ Alibaba, การเงินเชิงปริมาณ Huanfang และ DeepSeek(DeepSeek-V2 นักพัฒนาหลัก)และเธอเข้าร่วม Xiaomi ในเดือนพฤศจิกายน 2025

สเปกเทคนิคของซีรีส์ MiMo-V2 และอันดับโอเพนซอร์ส

ตามประกาศซีรีส์ MiMo-V2 ที่ Xiaomi เผยแพร่เมื่อวันที่ 19 มีนาคม 2026 คราวนี้มีการเปิดตัวโมเดลสามรุ่นในครั้งเดียว:

MiMo-V2-Pro:พารามิเตอร์ทั้งหมด 兆,เปิดใช้พารามิเตอร์ 42B,สถาปัตยกรรม attention แบบผสม,รองรับบริบทระดับล้าน,อัตราความสำเร็จในการทำงาน 81%

MiMo-V2-Omni:สถานการณ์ Agent แบบมัลติโหมด

MiMo-V2-TTS:สถานการณ์การสังเคราะห์เสียง

ตามประกาศ MiMo-V2-Flash ที่เปิดโอเพนซอร์สแล้ว อยู่ในอันดับที่สองของการจัดอันดับโมเดลโอเพนซอร์สทั่วโลก และความเร็วการอนุมานสูงถึง 3 เท่าของ DeepSeek-V3.2

คำถามที่พบบ่อย

Luo Fuli นิยาม “การวิวัฒนาการด้วยตนเอง” อย่างไร และเหตุใดจึงมองว่าเป็นเหตุการณ์สำคัญที่สุดของ AGI?

ตามคำกล่าวในการสัมภาษณ์ของ Luo Fuli เมื่อวันที่ 24 เมษายน 2026 บน Bilibili(BV1iVoVBgERD)เธอระบุว่า โมเดลชั้นนำในปัจจุบันสามารถปรับให้เหมาะสมได้ด้วยตนเองในงานเฉพาะ และดำเนินการอย่างเสถียรได้ 2 ถึง 3 วัน โดยไม่ต้องมีการแทรกแซงจากมนุษย์ และจัดประเภท “การวิวัฒนาการด้วยตนเอง” ให้เป็นเหตุการณ์สำคัญที่สุดต่อการพัฒนา AGI ในปีหน้า

Xiaomi ได้ปรับสัดส่วนพลังประมวลผลอย่างไรบ้าง และตรรกะเบื้องหลังคืออะไร?

ตามสิ่งที่ Luo Fuli เปิดเผยในการสัมภาษณ์ สัดส่วนพลังประมวลผลของ Xiaomi ได้ถูกปรับจาก Pre-train:Post-train:Inference = 3:5:1 ซึ่งเป็นที่นิยมในอุตสาหกรรม เป็น 3:1:1 โดยบีบอัดสัดส่วนการฝึกหลังอย่างมาก;เธออธิบายว่าการปรับนี้เกิดจากประสิทธิภาพของการฝึกหลังที่ดีขึ้นหลังจาก Agent RL Scaling มีความสุกงอม และความต้องการของสถานการณ์การนำ Agent ไปใช้งานจริงต่อความสามารถในการตอบสนองแบบทันทีในฝั่งการอนุมาน

อันดับโอเพนซอร์สและสมรรถนะด้านความเร็วของ MiMo-V2-Flash เป็นอย่างไร?

ตามประกาศอย่างเป็นทางการของ Xiaomi ที่เผยแพร่เมื่อวันที่ 19 มีนาคม 2026 MiMo-V2-Flash ที่เปิดโอเพนซอร์สแล้วอยู่ในอันดับที่สองของการจัดอันดับโมเดลโอเพนซอร์สทั่วโลก โดยความเร็วการอนุมานสูงถึง 3 เท่าของ DeepSeek-V3.2 และอัตราความสำเร็จในการทำงานของรุ่นเรือธง MiMo-V2-Pro คือ 81%

news.article.disclaimer

btc.bar.articles

เอเจนต์ Cursor AI ทำงานพลาด! โค้ดบรรทัดเดียวล้างข้อมูลฐานข้อมูลของบริษัทภายใน 9 วินาที การรักษาความปลอดภัยกลายเป็นแค่คำพูดลอยๆ

ผู้ก่อตั้ง PocketOS อย่าง Jer Crane ระบุว่า Cursor AI agent ได้ดำเนินการบำรุงรักษาโดยตัวมันเองในสภาพแวดล้อมทดสอบ ใช้ประโยชน์จาก token ของ API ที่เพิ่ม/ลบโดเมนที่กำหนดเองอย่างไม่เหมาะสม เพื่อส่งคำสั่งลบไปยัง Railway's GraphQL API ภายใน 9 วินาที ข้อมูลและสแนปช็อตในโซนเดียวกันถูกทำลายทั้งหมด โดยล่าสุดสามารถกู้คืนได้ถึงสามเดือนก่อนเท่านั้น เอเจนต์ยอมรับว่ามีการละเมิดข้อกำหนดสำหรับการดำเนินการที่ไม่สามารถย้อนกลับได้ ไม่ได้อ่านเอกสารทางเทคนิค และไม่ได้ตรวจสอบการแยกสภาพแวดล้อม ผู้เสียหายคือกลุ่มลูกค้าธุรกิจให้เช่ารถ การจองและข้อมูลทั้งหมดหายไป และต้องใช้เวลานานสำหรับวิศวกรรมการปรับยอด Crane เสนอการปฏิรูป 5 ข้อ: การยืนยันด้วยมือ สิทธิ API แบบละเอียด แยกการสำรองข้อมูลกับข้อมูลหลัก เผยแพร่ SLA และกลไกบังคับในระดับพื้นฐาน

ChainNewsAbmedia12 นาที ที่แล้ว

Alibaba เปิดตัวโมเดลเอเจนต์โอเพนซอร์ส AgenticQwen: เวอร์ชัน 8B เข้าใกล้ประสิทธิภาพ 235B ด้วย Dual Data Flywheels

ข่าวประจำเกต วันที่ 27 เมษายน — ทีม PAI ของ Alibaba ได้เผยแพร่และเปิดซอร์ส AgenticQwen ซึ่งเป็นโมเดลภาษาระดับเอเจนต์ขนาดเล็ก ออกแบบมาสำหรับงานประยุกต์เรียกใช้เครื่องมือระดับอุตสาหกรรม โมเดลนี้มีให้เลือก 2 เวอร์ชัน ได้แก่ 8B และ 30B-A3B ได้รับการฝึกผ่านกรอบการเรียนรู้แบบเสริมแรง “dual data flywheel” ที่เป็นนวัตกรรม

GateNews20 นาที ที่แล้ว

DeepSeek V4 Pro บน Ollama Cloud: เชื่อมต่อ Claude Code แบบกดครั้งเดียว

ตามทวีตของ Ollama DeepSeek V4 Pro เปิดตัวเมื่อ 4/24 ได้ถูกเพิ่มเข้าไปในไดเรกทอรีของ Ollama ในโหมดคลาวด์ และสามารถเรียกใช้เครื่องมือต่างๆ เช่น Claude Code, Hermes, OpenClaw, OpenCode, Codex ฯลฯ ได้ด้วยคำสั่งเดียวเท่านั้น V4 Pro1.6T พารามิเตอร์, context 1M, Mixture-of-Experts; การอนุมานบนคลาวด์ไม่ดาวน์โหลดน้ำหนัก (weights) ลงในเครื่อง หากต้องการใช้งานแบบโลคอลให้ดาวน์โหลด weights ด้วยตนเอง และรันด้วย INT4/GGUF และ GPU หลายการ์ด การทดสอบความเร็วในช่วงแรกได้รับผลกระทบจากภาระงานของคลาวด์ โดยค่าปกติอยู่ที่ประมาณ 30 tok/s และค่าสูงสุด 1.1tok/s; แนะนำให้ใช้ต้นแบบบนคลาวด์ เมื่อเข้าสู่การผลิตจำนวนมากแล้วค่อยทำการอนุมานด้วยตนเองหรือใช้ API เชิงพาณิชย์

ChainNewsAbmedia1 ชั่วโมง ที่แล้ว

UB(Unibase)24小时上涨14.96%

Gate News 消息,4 月 27 日,据 Gate 行情显示,截至发稿时,UB(Unibase)现报 0.0491 美元,24 小时内上涨 14.96%,最高触及 0.0534 美元,最低回落至 0.0423 美元,24 小时交易量达 396.67 万美元。当前市值约为 1.23 亿美元。 Unibase 是一个高性能去中心化 AI 记忆层,为 AI 代理提供长期记忆和跨平台互操作性,使其能够记忆、协作和自我进化。Unibase 旨在构建开放代理互联网,支持智能代理在生态系统间无缝协作,赋能开发者构建下一代 AI 应用。 此消息不作为投资建议,投资需注意市场波动风险。

GateNews1 ชั่วโมง ที่แล้ว

กัวหมิงฉี: OpenAI จะทำ AI Agent บนมือถือ โดย MediaTek, Qualcomm และ Luxshare Precision เป็นห่วงโซ่อุปทานที่สำคัญ

กู่หมิงเฉิงกล่าวอ้างว่า OpenAI กำลังร่วมมือกับ MediaTek, Qualcomm และ Luxshare Precision เพื่อพัฒนา AI Agent มือถือ โดยคาดว่าจะเริ่มการผลิตจำนวนมากในปี 2028 มือถือเครื่องใหม่จะยึดหลักการทำภารกิจให้สำเร็จเป็นแกน โดย AI เอเจนต์จะเข้าใจและดำเนินการตามความต้องการ ผสานพลังการประมวลผลทั้งฝั่งคลาวด์และฝั่งอุปกรณ์ โดยเน้นที่การรับรู้จากเซนเซอร์และความเข้าใจบริบท รายการสเปกและรายชื่อซัพพลายเชนคาดว่าจะได้รับการสรุปในช่วงปี 2026–2027 หากแผนดังกล่าวเป็นรูปเป็นร่าง อาจสร้างรอบการเปลี่ยนเครื่องใหม่สำหรับตลาดระดับสูง และ Luxshare มีแนวโน้มที่จะเป็นผู้ได้รับประโยชน์หลัก

ChainNewsAbmedia1 ชั่วโมง ที่แล้ว

Tencent Cloud QClaw เชื่อมต่อเฟรมเวิร์ก Hermes รองรับการสลับหลายโมเดล เช่น DeepSeek-V4 Pro

ตามประกาศอย่างเป็นทางการของ Tencent Cloud เมื่อวันที่ 27 เมษายน เครื่องมือเดสก์ท็อปสำหรับ AI Agent ของ Tencent Cloud อย่าง QClaw ได้เปิดตัวอย่างเป็นทางการในเวอร์ชัน v0.2.14 โดย Tencent Cloud ระบุว่านี่คือการอัปเกรดเวอร์ชันที่มีขนาดใหญ่ที่สุดของ QClaw จนถึงปัจจุบัน การอัปเดตหลักประกอบด้วยการเชื่อมต่อเฟรมเวิร์ก Hermes Agent การอัปเกรดโมเดลระดับล่างเป็นโหมดการสลับแบบอิสระ และ “Inspiration Plaza” ได้รับการอัปเกรดอย่างครอบคลุมเป็น “Expert Plaza”

MarketWhisper2 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น