智元 GE-Sim 2.0:用世界模型生成世界,宇树劲敌将人形机器人推向自我进化

鏈新聞abmedia

具身智慧(Embodied AI)正迎来一个关鍵转折点。中国智元机器人近期发布 Genie Envisioner World Simulator 2.0(GE-Sim 2.0),試圖將 World Model(世界模型)从單純理解環境的工具,推进为可以直接运行、訓練与優化机器人的世界模擬器(World Simulator)。

如果你还不了解这有多关鍵,不妨先看看 LLM 架構的硬傷:訓練逻辑上现存 LLM 只是根據龐大语料庫来预測上下文,它可以知道「蘋果掉下来」这幾个字常一起出现,但並不真正理解重力或物理世界的因果关係。

这就是为什麼楊立昆、李飞飞等科学家都投身於 World Model 賽道,当 AI 具備对 3D 環境的理解与物理预測能力后,这項技術將成为自主机器人、自动駕駛与智慧製造等「实體AI」(Physical AI)的數位大腦。因此,World Model 的路線主張,机器人將会是十分关鍵的載體。如今等身机器人廠商智元机器人入局,象徵中国从硬體逆襲的先鋒。

先前台積电董事长魏哲家曾表示:如果看中国大陸一直弄机器人可跳来跳去蹦蹦跳。那个沒用,只是好看头而已。他指出关鍵在於要让机器人大腦能运作,而大腦誰在做,輝达 (Nvidia)、超微 (AMD) 与一堆美国公司,但 95% 大腦是台積电製造。GE-Sim 2.0 发展瓶頸仍在,与中国的模型发展強綁定。

World Model 的路線主張,机器人是关鍵

当前主流的 LLM 依靠龐大的语料庫与统计关係来理解上下文,並预測下一个詞语。它可以知道「蘋果掉下来」这幾个字常一起出现,但並不真正理解重力或物理世界的因果关係。

这種模式在文本生成、程式輔助或问答任務上表现出色,但在需要理解现实世界結構、推理因果关係与长期規劃的场景中,仍存在根本限制。更大的问題在於數據来源正在逐漸枯竭。LLM 的訓練高度依賴高品质人類资料,而近年业界已开始警告,可用的人類文本资料可能在未来幾年內被消耗殆盡。屆时就像近親繁殖可能遺傳缺陷,最終導致模型逐漸偏离现实並出现性能退化。

(深度解析:LLM 存在缺陷?为何楊立昆的 AMI 押注 World Model 路線)

这也是为什麼近年 AI 学界两位重量級人物楊立昆与被稱为「AI 教母」的李飞飞(Fei-Fei Li)都选擇押在被稱为 World Model(世界模型) 的新一代 AI 架構。

当时筆者曾表示:延伸来看,当 AI 具備对 3D 環境的理解与物理预測能力后,这項技術將成为自主机器人、自动駕駛与智慧製造等「实體AI」(Physical AI)的數位大腦。因此,World Model 的路線主張,机器人將会是十分关鍵的載體。如今等身机器人廠商智元机器人入局,象徵中国从硬體逆襲的先鋒。

先前台積电董事长魏哲家,在談及机器人与半導體发展时直言,如果看中国大陸一直弄机器人可跳来跳去蹦蹦跳。那个沒用,只是好看头而已。他指出关鍵在於要让机器人大腦能运作,而大腦誰在做,輝达 (Nvidia)、超微 (AMD) 与一堆美国公司,但 95% 大腦是台積电製造。

(台積电魏哲家酸:中国机器人蹦蹦跳,只是好看头沒用!关鍵仍来自輝达)

World Model 进化:从理解世界,到在世界中学習

过去幾年,World Model 一直被視为 AI 理解现实的关鍵技術。透过影像、语言与感測數據,模型可以预測環境變化,让机器人具備基本決策能力。

但 GE-Sim 2.0 的核心突破在於不只是理解世界,而是直接在「模型生成的世界」中学習与行动系统將行动(Action)納入核心變數,从傳统的狀態预測,升級为完整循環:

State

Action

State Evolution

这意味著,机器人不再只是觀察与回应,而是能在模擬環境中主动試错、自主優化、持续学習。这種转變,使 World Model 从「认知模型」进化为「訓練基礎设施」。

GE-Sim 2.0:让机器人在虛擬世界中「进化」

GE-Sim 2.0 被定義为一套「具身世界模擬器」,核心目標是解決现实訓練的三大瓶頸:成本过高、數據不足、难以規模化。透过模型生成環境,系统可以在不依賴真实世界的情況下,大規模訓練机器人。

技術上,GE-Sim 2.0 整合三个关鍵能力:首先是「动作驅动影像生成」,模型能根據机器人动作生成对应的未来畫面,並保持多視角一致性,包括头部視角与左右手操作視角。

其次是本體感知(proprioception)建模,不只模擬外部畫面,还能预測机器人自身关節与动作狀態,让決策更接近真实物理世界。

第三是「自动任務評估」,透过內建的 reward model(獎勵模型),系统可自动判斷任務是否完成,例如「將藍色物體放入紅色盒子」,並給出回饋,直接用於強化学習。这使得机器人可以在模擬環境中完成完整閉環:

GE-Sim 2.0 已能实现「分鐘級」穩定影片生成

相较早期模型僅能生成短片段,GE-Sim 2.0 已能实现「分鐘級」穩定影片生成,支援长时间任務模擬。同时,透过大規模真实數據(远端操作、部署与交互數據)訓練,模型在不同场景与任務间具備更強泛化能力。这一点对於人形机器人尤其关鍵:因为现实世界的操作高度多變,无法單靠固定场景訓練。

World Simulator 的出现,意味著机器人可以在虛擬世界中「无限練習」这將帶来两个結構性變化:第一,訓練成本大幅下降。第二,能力迭代速度呈指數級提升。

智元机器人:中国人形机器人新勢力

智元机器人 成立於 2023 年,由华为「天才少年」彭志輝 創辦,專注於 AI 与机器人融合的具身智能领域。

公司核心产品包括:

「远征」系列人形机器人

「靈犀」机器人系统

通用大模型 GO-1

目前已完成多輪融资,並獲紅杉中国、高瓴资本等机構投资,被視为中国人形机器人领域的重要玩家,与宇樹科技形成競爭格局。

这篇文章 智元 GE-Sim 2.0:用 World Model 生成世界,宇樹勁敵將人形机器人推向自我进化 最早出现於 链新聞 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Sam Altman 阐述 OpenAI 的五项运营原则,暗示为安全可能实施的未来模型能力限制

Gate News 消息,4月27日——OpenAI 首席执行官 Sam Altman 以其个人署名发布了公司五项运营原则,表明 OpenAI 可能会在某些时期限制用户访问模型能力,以优先考虑安全。在声明中,Altman 描述了一个潜在的未来情景,即公司需要“在牺牲部分赋能以换取更强韧性”的情况下推进。

GateNews39 分钟前

DeepSeek 延迟 V4 推出 以优化适配华为的昇腾芯片

Gate News 消息,4月27日——DeepSeek 推迟了其 V4 模型的发布,以便对其软件堆栈进行微调以适配华为的昇腾芯片,反映出北京更广泛的举措:随着对先进外国半导体的获取日益受限,推动建设本土 AI 供应链。 DeepSe

GateNews1小时前

DeepSeek将输入缓存价格砍到发布价的1/10;V4-Pro降至每百万Tokens 0.025元

Gate 新闻消息,4月26日——DeepSeek已将其全系列模型的输入缓存价格下调至发布时价格的1/10,自即日起生效。V4-Pro模型现正限时享受2.5倍折扣促销,促销将持续至2026年5月5日23:59(UTC+8)。 在同时两次下调之后

GateNews10小时前

OpenAI 招揽顶级企业软件人才,前沿代理颠覆行业

Gate News 消息,4月26日——OpenAI 和 Anthropic 一直在从包括 Salesforce、Snowflake、Datadog 和 Palantir 在内的主要企业软件公司招募高级高管和专业工程师。Denise Dresser,前 Salesforce 旗下 Slack 的 CEO,已加入 OpenAI,担任首席营收官

GateNews10小时前

百度千帆推出对 DeepSeek-V4 的 Day 0 支持,并提供 API 服务

Gate 新闻消息,4月25日——DeepSeek-V4 预览版已于4月25日上线并开源,百度智能云旗下的百度千帆平台提供 Day 0 API 服务适配。该模型具备百万 token 的扩展上下文窗口,并提供两个版本:DeepSeek-V4

GateNews16小时前

斯坦福 AI 课程结合业界领袖黄仁勋、Altman,挑战用十周为世界创造价值!

史丹佛大学(Stanford University)近期开设的 AI 电脑科学课程《Frontier Systems》引发产学界高度关注,吸引逾五百名学生选修。课程由顶级创投 a16z 合伙人 Anjney Midha 统筹,讲师涵盖英伟达执行长黄仁勋 (Jensen Huang)、OpenAI 创办人 Sam Altman、微软执行长纳德拉 (Satya Nadella) 、AMD 执行长苏姿丰 (Lisa Su) 等豪华阵容。让学生尝试用十周“为世界创造价值”! 黄仁勋、Altman 业界领袖亲自登台讲课 本课程由顶级创投 a16z 合伙人 Anjney Midha 统筹,汇聚AI产业链

鏈新聞abmedia17小时前
评论
0/400
暂无评论