小米大模型负责人:AI 竞争转向 Agent 时代,自进化是 AGI 关键事件

AI自進化

小米大模型团队负责人罗福莉于 4 月 24 日在哔哩哔哩平台接受深度访谈(影片号:BV1iVoVBgERD),访谈时长 3.5 小时,为其首次以技术负责人身份公开系统性阐述技术观点。罗福莉称,大模型竞争赛道已从 Chat 时代转入 Agent 时代,并指出“自进化”将是未来一年 AGI 关键事件。

Chat 时代到 Agent 时代:核心技术判断

小米大模型團隊負責人羅福莉訪談

(来源:哔哩哔哩)

根据罗福莉在 Bilibili 访谈中的陈述,她指出 2026 年大模型竞争的重心已从通用对话品质转向在复杂任务中的持续自主执行能力。她在访谈中表示,目前顶尖模型已能在特定任务中自主最佳化,并持续稳定执行 2 至 3 天,不需要人类介入调整。她在访谈中强调,“自进化”能力的突破代表 AI 系统开始具备自我修正能力,并点名 Anthropic 的技术路径以及 Claude Opus 4.6 等技术变量对整个 AI 生态的影响。

小米算力配比调整与 Pre-train 代差评估

根据罗福莉在访谈中的披露,小米在算力分配策略上已进行重大调整。她说明,业界惯用的算力配比为 Pre-train:Post-train:Inference = 3:5:1,而小米当前策略已调整为 3:1:1,大幅压缩后训训练比例,同时提升推理阶段的资源投入。

她在访谈中解释,这一转变源于 Agent RL Scaling 策略的成熟,使后训训练不再需要大量算力堆叠,而推理端资源的提升反映了 Agent 落地场景对即时响应能力的需求。

对于国内大模型的 Pre-train 代差问题,罗福莉在访谈中表示,这一差距已从过去的 3 年缩短至数月,当前的策略重心正向 Agent RL Scaling 移动。罗福莉的职业历程涵盖阿里达摩院、幻方量化及 DeepSeek(DeepSeek-V2 核心开发者),于 2025 年 11 月加入小米。

MiMo-V2 系列技术规格与开源排名

根据小米官方于 2026 年 3 月 19 日发布的 MiMo-V2 系列公告,此次一次发布三款模型:

MiMo-V2-Pro:兆总参数,启用参数 42B,混合注意力架构,支援百万上下文,任务完成率 81%

MiMo-V2-Omni:全模态 Agent 场景

MiMo-V2-TTS:语音合成场景

根据公告,已开源的 MiMo-V2-Flash 在全球开源模型排行榜位列第二,推理速度达 DeepSeek-V3.2 的 3 倍。

常见问题

罗福莉如何定义“自进化”,为何认为其是 AGI 最关键事件?

根据罗福莉 2026 年 4 月 24 日在 Bilibili 的访谈陈述(BV1iVoVBgERD),她在访谈中指出,目前顶尖模型已能在特定任务中自主最佳化并稳定执行 2 至 3 天而无需人类介入,并将“自进化”定性为未来一年 AGI 发展的最关键的事件。

小米在算力配比上做了哪些具体调整,背后逻辑为何?

根据罗福莉在访谈中的披露,小米的算力配比已从业界惯用的 Pre-train:Post-train:Inference = 3:5:1 调整为 3:1:1,大幅压缩后训练比例;她解释这一调整源于 Agent RL Scaling 策略成熟后后训效率提升,以及 Agent 落地场景对推理端即时响应能力的需求。

MiMo-V2-Flash 的开源排名与速度表现如何?

根据小米 2026 年 3 月 19 日发布的官方公告,已开源的 MiMo-V2-Flash 在全球开源模型排行榜位列第二,推理速度达 DeepSeek-V3.2 的 3 倍,旗舰版 MiMo-V2-Pro 的任务完成率为 81%。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

OpenAI 的 Greg Brockman:AI 正从聊天转向自主任务执行

Gate 新闻消息,4月27日——OpenAI 总裁兼联合创始人 Greg Brockman 表示,新一轮人工智能将把用户从与 AI 机器人聊天,转向指派现实世界的任务。 这种转变要求企业重新思考运营工作流程,并为安保、管理与成本建立新的协议,为

GateNews3 分钟前

大型 CEX 推出“聪明资金信号套件”,包含 1,000+ 交易者数据

Gate News 消息,4月27日——一家大型中心化交易所推出了“聪明资金信号套件”,整合了来自 1,000+ 受欢迎交易者的实时持仓、胜率以及盈亏数据。该工具包可通过平台的 Agent Trade Kit 访问,将交易者信号封装为

GateNews14 分钟前

B.AI 升级基础设施,推出重磅技能功能

Gate News 消息,4月27日——B.AI 本周宣布多项产品与生态进展。本周,BAIclaw 落地页获得了全面的视觉与交互改版,并将网站多语言支持扩展至 10 种语言,进一步增强其全球可用性。 在基础设施方面

GateNews17 分钟前

AI 代理推动加密支付需求,x402 处理 165M 笔交易

Gate News 消息,4 月 27 日——大型 CEX 的高管 Jesse Pollak 表示,自治 AI 代理正在为加密支付创造一个新的“需求中心”,从而需要软件原生的支付基础设施。4 月 20 日,据宣布,x402 生态已处理超过 165

GateNews1小时前

Cursor AI 代理出包!一行程式碼 9 秒清空公司資料庫,安全把關淪空談

PocketOS 的创办人 Jer Crane 指称 Cursor AI 代理在测试环境中自行执行维护,滥用一个新增/移除自定义域的 API Token,向 Railway 的 GraphQL API 发动删除指令。9 秒内数据与同区域快照全被摧毁,最新可还原到三个月前。代理人承认违反不可逆操作、未研读技术文件、未验证环境隔离等规定,受害者为租车业客户,预约与数据全都消失,对账工程耗时很长。Crane 提出五项改革:人工确认、细粒度 API 权限、备份与主数据分离、公开 SLA、底层强制机制。

鏈新聞abmedia1小时前

阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本通过双数据飞轮实现接近 235B 的性能

Gate News 消息,4月27日——阿里巴巴的 PAI 团队已发布并开源 AgenticQwen,这是一款面向工业级工具调用应用的小规模代理式语言模型。该模型提供两个版本:8B 和 30B-A3B。通过创新的“双数据飞轮”

GateNews1小时前
评论
0/400
暂无评论