小米 MiMo-V2.5 系列開源:相較 GPT-5.4 的 1T 參數,具有更優的 token 效率

Gate 新聞訊息,4月27日——小米的 MiMo 團隊已在 MIT 授權下開源 MiMo-V2.5 系列大型語言模型,支援商業部署、持續訓練與微調。兩個模型都具備 100 萬 token 的上下文視窗。MiMo-V2.5-Pro 是一種純文字的專家混合 (MoE) 模型,總參數為 1.02 兆(trillion),啟用參數為 420 億;而 MiMo-V2.5 是原生多模態模型,總參數為 3100 億,啟用參數為 150 億,支援文字、圖像、影片與音訊理解。

MiMo-V2.5-Pro 目標鎖定複雜的代理(agent)與程式設計任務。在 ClawEval 基準測試中,它在每個任務軌跡約消耗 70,000 個 token 的情況下達成 64% 的 Pass@3——相較 Claude Opus、Gemini 3.1 Pro 與 GPT-5.4,token 減少 40% 到 60%。該模型在 SWE-bench Verified 上得分 78.9。在一項展示中,V2.5-Pro 能在 4.3 小時內、透過 672 次工具呼叫,獨立完成為北京大學編譯器課程專案開發的完整 SysY-to-RISC-V 編譯器,並在隱藏測試集上取得 233/233 的滿分。

MiMo-V2.5 專為多模態代理情境而設計,配備專用的視覺編碼器 (729 million parameters) 與音訊編碼器 (261 million parameters),在 Claw-Eval 的一般子集上得分 62.3。兩個模型採用結合滑動視窗注意力 (SWA) 與全域注意力 (GA) 的混合架構,並搭配 3 層的多 token 預測 (MTP) 模組以加速推論。模型權重可在 Hugging Face 取得。

在開源發布的同時,MiMo 團隊推出了「Orbit Quadrillion Token Creator Incentive Program(Orbit Quadrillion Token Creator 獎勵計畫)」,向全球使用者在 30 天內免費提供 100 兆 token。個別開發者、團隊與企業可透過計畫頁面申請,評估週期約為 3 個工作日;核准後的權益將以 Token Plans 或直接抵扣的形式分發,並與像 Claude Code、Cursor 等工具相容。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Cerebras 獲 OpenAI 200 億美元協議,IPO 目標估值 350 億

根據 The Motley Fool 4 月 27 日的報道,AI 晶片製造商 Cerebras Systems 的 S-1 文件顯示,公司剩餘履約義務(RPO)達 246 億美元,2025 年全年營收為 5.1 億美元;報道指出公司 IPO 目標估值約 350 億美元,對應市銷率約 70 倍。

Market Whisper7分鐘前

中國禁止 Meta 以 20 億收購 AI 新創 Manus,已要求撤回交易

根據 BBC 及 CNBC 於 4 月 27 日報道,中國國家發展和改革委員會(NDRC)已叫停 Meta Platforms 以約 20 億美元收購 AI 新創公司 Manus 的交易,NDRC 在聲明中要求相關各方撤回收購交易。Meta 發言人表示,該交易「完全符合適用法律」,並期待調查能得到妥善解決。

Market Whisper11分鐘前

ASML 因 AI 數據中心需求成長而使 EUV 產量提升 36%

荷蘭晶片設備製造商 ASML 計劃在 2026 年將極紫外 (EUV) 微影機的產量提高約 36%,原因是來自 AI 資料中心擴建的需求成長,根據該公司的最新指引。 ASML 目標至少製造 60 套標準 EUV 系統 i

Crypto Frontier34分鐘前

OpenAI 未能達成用戶成長與銷售目標,引發外界對 AI 基礎設施支出憂慮

Gate News 訊息,4 月 28 日——據《華爾街日報》報導,OpenAI 未能達成其內部在新增用戶獲取與銷售成長方面的目標,這引發了公司內部對於能否持續在人工智慧基礎設施上進行龐大支出的擔憂

GateNews35分鐘前

Microsoft 導入 Copilot 給 743,000 位 Accenture 員工

根據路透社報導,微軟正在向埃森哲所有 743,000 名員工全面推出 Microsoft 365 Copilot,這也是其迄今為止最大的企業部署。此舉擴大了埃森哲 2024 年的計畫,將 Copilot 提供給多達 300,000 名員工。 埃森哲調查

Crypto Frontier1小時前

DeepSeek 註冊資本增加 50%,創辦人梁文鋒持股升至 34%

Gate News 消息,4月28日——根據企查查數據,DeepSeek (Hangzhou Deepseek AI Basic Technology Research Co., Ltd.)註冊資本由1000萬元人民幣增加至1500萬元人民幣。創辦人梁文鋒的註冊資本出資額由100萬元人民幣增至510萬元人民幣

GateNews1小時前
留言
0/400
暫無留言