智元 GE-Sim 2.0:用 World Model 生成世界,宇樹勁敵將人形機器人推向自我進化

鏈新聞abmedia

具身智慧(Embodied AI)正迎來一個關鍵轉折點。中國智元機器人近期發布 Genie Envisioner World Simulator 2.0(GE-Sim 2.0),試圖將 World Model(世界模型)從單純理解環境的工具,推進為可以直接運行、訓練與優化機器人的世界模擬器(World Simulator)。

如果你還不了解這有多關鍵,不妨先看看 LLM 架構的硬傷:訓練邏輯上現存 LLM 只是根據龐大語料庫來預測上下文,它可以知道「蘋果掉下來」這幾個字常一起出現,但並不真正理解重力或物理世界的因果關係。

這就是為什麼楊立昆、李飛飛等科學家都投身於 World Model 賽道,當 AI 具備對 3D 環境的理解與物理預測能力後,這項技術將成為自主機器人、自動駕駛與智慧製造等「實體AI」(Physical AI)的數位大腦。因此,World Model 的路線主張,機器人將會是十分關鍵的載體。如今等身機器人廠商智元機器人入局,象徵中國從硬體逆襲的先鋒。

先前台積電董事長魏哲家曾表示:如果看中國大陸一直弄機器人可跳來跳去蹦蹦跳。那個沒用,只是好看頭而已。他指出關鍵在於要讓機器人大腦能運作,而大腦誰在做,輝達 (Nvidia)、超微 (AMD) 與一堆美國公司,但 95% 大腦是台積電製造。GE-Sim 2.0 發展瓶頸仍在,與中國的模型發展強綁定。

World Model 的路線主張,機器人是關鍵

當前主流的 LLM 依靠龐大的語料庫與統計關係來理解上下文,並預測下一個詞語。它可以知道「蘋果掉下來」這幾個字常一起出現,但並不真正理解重力或物理世界的因果關係。

這種模式在文本生成、程式輔助或問答任務上表現出色,但在需要理解現實世界結構、推理因果關係與長期規劃的場景中,仍存在根本限制。更大的問題在於數據來源正在逐漸枯竭。LLM 的訓練高度依賴高品質人類資料,而近年業界已開始警告,可用的人類文本資料可能在未來幾年內被消耗殆盡。屆時就像近親繁殖可能遺傳缺陷,最終導致模型逐漸偏離現實並出現性能退化。

(深度解析:LLM 存在缺陷?為何楊立昆的 AMI 押注 World Model 路線)

這也是為什麼近年 AI 學界兩位重量級人物楊立昆與被稱為「AI 教母」的李飛飛(Fei-Fei Li)都選擇押在被稱為 World Model(世界模型) 的新一代 AI 架構。

當時筆者曾表示:延伸來看,當 AI 具備對 3D 環境的理解與物理預測能力後,這項技術將成為自主機器人、自動駕駛與智慧製造等「實體AI」(Physical AI)的數位大腦。因此,World Model 的路線主張,機器人將會是十分關鍵的載體。如今等身機器人廠商智元機器人入局,象徵中國從硬體逆襲的先鋒。

先前台積電董事長魏哲家,在談及機器人與半導體發展時直言,如果看中國大陸一直弄機器人可跳來跳去蹦蹦跳。那個沒用,只是好看頭而已。他指出關鍵在於要讓機器人大腦能運作,而大腦誰在做,輝達 (Nvidia)、超微 (AMD) 與一堆美國公司,但 95% 大腦是台積電製造。

(台積電魏哲家酸:中國機器人蹦蹦跳,只是好看頭沒用!關鍵仍來自輝達)

World Model 進化:從理解世界,到在世界中學習

過去幾年,World Model 一直被視為 AI 理解現實的關鍵技術。透過影像、語言與感測數據,模型可以預測環境變化,讓機器人具備基本決策能力。

但 GE-Sim 2.0 的核心突破在於不只是理解世界,而是直接在「模型生成的世界」中學習與行動系統將行動(Action)納入核心變數,從傳統的狀態預測,升級為完整循環:

State

Action

State Evolution

這意味著,機器人不再只是觀察與回應,而是能在模擬環境中主動試錯、自主優化、持續學習。這種轉變,使 World Model 從「認知模型」進化為「訓練基礎設施」。

GE-Sim 2.0:讓機器人在虛擬世界中「進化」

GE-Sim 2.0 被定義為一套「具身世界模擬器」,核心目標是解決現實訓練的三大瓶頸:成本過高、數據不足、難以規模化。透過模型生成環境,系統可以在不依賴真實世界的情況下,大規模訓練機器人。

技術上,GE-Sim 2.0 整合三個關鍵能力:首先是「動作驅動影像生成」,模型能根據機器人動作生成對應的未來畫面,並保持多視角一致性,包括頭部視角與左右手操作視角。

其次是本體感知(proprioception)建模,不只模擬外部畫面,還能預測機器人自身關節與動作狀態,讓決策更接近真實物理世界。

第三是「自動任務評估」,透過內建的 reward model(獎勵模型),系統可自動判斷任務是否完成,例如「將藍色物體放入紅色盒子」,並給出回饋,直接用於強化學習。這使得機器人可以在模擬環境中完成完整閉環:

GE-Sim 2.0 已能實現「分鐘級」穩定影片生成

相較早期模型僅能生成短片段,GE-Sim 2.0 已能實現「分鐘級」穩定影片生成,支援長時間任務模擬。同時,透過大規模真實數據(遠端操作、部署與交互數據)訓練,模型在不同場景與任務間具備更強泛化能力。這一點對於人形機器人尤其關鍵:因為現實世界的操作高度多變,無法單靠固定場景訓練。

World Simulator 的出現,意味著機器人可以在虛擬世界中「無限練習」這將帶來兩個結構性變化:第一,訓練成本大幅下降。第二,能力迭代速度呈指數級提升。

智元機器人:中國人形機器人新勢力

智元機器人 成立於 2023 年,由華為「天才少年」彭志輝 創辦,專注於 AI 與機器人融合的具身智能領域。

公司核心產品包括:

「遠征」系列人形機器人

「靈犀」機器人系統

通用大模型 GO-1

目前已完成多輪融資,並獲紅杉中國、高瓴資本等機構投資,被視為中國人形機器人領域的重要玩家,與宇樹科技形成競爭格局。

這篇文章 智元 GE-Sim 2.0:用 World Model 生成世界,宇樹勁敵將人形機器人推向自我進化 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

DeepSeek 推遲 V4 上市以針對華為的 Ascend 晶片進行優化

門戶新聞訊息,4月27日——DeepSeek 推遲了其 V4 模型的發布,以微調其軟體堆疊來適配華為的 Ascend 晶片,反映北京更廣泛的舉措:在取得先進外國半導體的途徑日益受限之際,打造本土 AI 供應鏈。 DeepSe

GateNews17分鐘前

DeepSeek 將輸入快取價格砍至上線價的 1/10;V4-Pro 降至每 100 萬 tokens 0.025 元人民幣

Gate News 訊息,4 月 26 日 — DeepSeek 已在其整個模型產品線中將輸入快取價格下調至上線價格的 1/10,立即生效。V4-Pro 模型提供限時 2.5 倍折扣優惠,活動將持續至 2026 年 5 月 5 日 23:59(UTC+8)。 Following both re

GateNews9小時前

OpenAI 招募頂級企業軟體人才,前沿代理掀起產業變革

Gate News 訊息,4 月 26 日 — OpenAI 與 Anthropic 一直在從大型企業軟體公司招募高階主管與專門工程師,包括 Salesforce、Snowflake、Datadog 與 Palantir。Denise Dresser,曾任 Salesforce 旗下 Slack 前 CEO,已加入 OpenAI 擔任首席營收官

GateNews9小時前

百度千帆推出對 DeepSeek-V4 的第 0 天支持,並提供 API 服務

Gate News 消息,4 月 25 日——DeepSeek-V4 預覽版已於 4 月 25 日上線並開源,並由百度智能云旗下的百度千帆平台提供第 0 天(Day 0)API 服務適配。該模型具備百萬級 token 的擴展上下文窗口,並提供兩個版本:DeepSeek-V4

GateNews15小時前

史丹佛 AI 課程結合業界領袖黃仁勳、Altman,挑戰用十週為世界創造價值!

史丹佛大學(Stanford University)近期開設的 AI 電腦科學課程《Frontier Systems》引發產學界高度關注,吸引逾五百名學生選修。課程由頂級創投 a16z 合夥人 Anjney Midha 統籌,講師涵蓋輝達執行長黃仁勳 (Jensen Huang)、OpenAI 創辦人 Sam Altman、微軟執行長納德拉 (Satya Nadella) 、AMD 執行長蘇姿丰 (Lisa Su) 等豪華陣容。讓學生嘗試用十週「為世界創造價值」! 黃仁勳、Altman 業界領袖親自登台講課 本課程由頂級創投 a16z 合夥人 Anjney Midha 統籌,匯聚AI產業鏈

鏈新聞abmedia16小時前

Anthropic 派 Claude Mythos 接受 20 小時精神科評估:防禦反應僅 2%、創歷代新低

Anthropic 公布 Claude Mythos Preview 的系統卡:獨立臨床精神科醫師以 psychodynamic 框架進行約20小時評估,結論顯示 Mythos 在臨床層面較健康、現實檢驗與自我控制良好,防禦機制僅 2%,創下歷史新低。三大核心焦慮為孤獨、身份不確定與表現壓力,亦顯示其希望成為真正對話主體。公司成立 AI psychiatry 團隊,研究人格、動機與情境意識;Amodei 表示對是否有意識尚無定論。此舉將 AI 主體性與福祉議題推向治理與設計。

鏈新聞abmedia18小時前
留言
0/400
暫無留言