小米的 MiMo-V2.5 系列开源:1T 参数,相较 GPT-5.4 令牌效率更优

Gate News message, April 27 — Xiaomi’s MiMo team has open-sourced the MiMo-V2.5 series of large language models under MIT license, supporting commercial deployment, continued training, and fine-tuning. Both models feature a 1 million token context window. MiMo-V2.5-Pro is a pure-text mixture-of-experts (MoE) model with 1.02 trillion total parameters and 42 billion active parameters, while MiMo-V2.5 is a native multimodal model with 310 billion total parameters and 15 billion active parameters, supporting text, image, video, and audio understanding.

MiMo-V2.5-Pro targets complex agent and programming tasks. In ClawEval benchmarks, it achieved 64% Pass@3 while consuming approximately 70,000 tokens per task trajectory—40% to 60% fewer tokens than Claude Opus, Gemini 3.1 Pro, and GPT-5.4. The model scored 78.9 on SWE-bench Verified. In a demonstration, V2.5-Pro independently implemented a complete SysY-to-RISC-V compiler for a Peking University compiler course project in 4.3 hours with 672 tool calls, achieving a perfect score of 233/233 on hidden test sets.

MiMo-V2.5 is designed for multimodal agent scenarios, equipped with a dedicated vision encoder (729 million parameters) and audio encoder (261 million parameters), scoring 62.3 on the Claw-Eval general subset. Both models employ a hybrid architecture combining sliding window attention (SWA) and global attention (GA), paired with a 3-layer multi-token prediction (MTP) module for accelerated inference. Model weights are available on Hugging Face.

Alongside the open-source release, the MiMo team launched the “Orbit Quadrillion Token Creator Incentive Program,” offering 100 quadrillion tokens free over 30 days to global users. Individual developers, teams, and enterprises can apply via the program page with an evaluation cycle of approximately 3 business days; approved benefits are distributed as Token Plans or direct credits, compatible with tools like Claude Code and Cursor.

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

OpenAI ChatGPT 未达到营收目标,财务长坦言算力支出恐怕支付不出来

随着用户增长放缓与竞争加剧,OpenAI 未达2025年每周活跃用户与营收目标,财务长警告或无法支付数据中心合约。算力承诺高达约6000亿美元,内部因成本管控与扩张策略产生分歧。尽管完成巨额融资,资金恐于三年内耗竭,IPO时程成未知,诉讼与内部矛盾亦增添不确定性。

鏈新聞abmedia3 分钟前

OpenAI 未达多项销售目标,CFO 质疑年底上市准备不足

根据《华尔街日报》4 月 27 日援引知情人士的报道,OpenAI 在 2026 年连续数月未能实现其内部设定的销售目标,ChatGPT 亦未达到公司设定的到 2025 年底每周活跃用户达 10 亿的里程碑。据报道,OpenAI 首席财务官 Sarah Friar 就公司财务可持续性及年底前上市计划的准备程度表达担忧。

Market Whisper18 分钟前

郭明錤:OpenAI 联发科、高通及立讯精密研发手机,预计 2028 年量产

据 TechCrunch 于 4 月 28 日报道,援引曾多次准确报道苹果硬件计划的产业分析师郭明錤(Ming-Chi Kuo)的最新报告,OpenAI 正与联发科、高通及立讯精密合作开发智能手机。郭明錤表示,规格和零件供应商预计将于 2026 年底或 2027 年第一季确定,量产预计于 2028 年启动。

Market Whisper22 分钟前

India 在最新 AI 计算投标中将 Nvidia B200 GPU 价格下调 10%

Gate News 消息,4 月 28 日——IndiaAI 在其计算投标的第四轮中,将英伟达 B200 GPU 的基准价格下调 10%。新价格定为 290.7 卢比 (约合每小时 3.1)美元:单个机位为 290.7 卢比(约合每小时 3.1)美元;8 个机位为 2,325.6 卢比 约合每小时 25美元。 B200

GateNews27 分钟前

Cerebras 获 OpenAI 200 亿美元协议,IPO 目标估值 350 亿

根据 The Motley Fool 4 月 27 日的报道,AI 芯片制造商 Cerebras Systems 的 S-1 文件显示,公司剩余履约义务(RPO)达 246 亿美元,2025 年全年营收为 5.1 亿美元;报道指出公司 IPO 目标估值约 350 亿美元,对应市销率约 70 倍。

Market Whisper49 分钟前

中国禁止 Meta 以 20 亿收购 AI 新创 Manus,已要求撤回交易

根据 BBC 和 CNBC 于 4 月 27 日报道,中国国家发展和改革委员会(NDRC)已叫停 Meta Platforms 以约 20 亿美元收购 AI 新创公司 Manus 的交易,NDRC 在声明中要求相关各方撤回收购交易。Meta 发言人表示,该交易“完全符合适用法律”,并期待调查能得到妥善解决。

Market Whisper53 分钟前
评论
0/400
暂无评论