Google Research 發布 ReasoningBank:AI 代理從成功與失敗中學習推理策略

Gate 新聞訊息,4 月 22 日 — Google Research 發布 ReasoningBank:一種代理記憶框架,可讓由大型語言模型驅動的代理在部署後持續學習。該框架從成功與失敗的任務經驗中提取通用推理策略,並將其存入記憶庫,以便在未來相似任務中進行檢索與執行。相關論文已發表於 ICLR,程式碼也已在 GitHub 上開源。

ReasoningBank 優於兩種既有方法:Synapse 會記錄完整的動作軌跡,但由於粒度較細,因而可遷移性有限;Agent Workflow Memory 只會從成功案例中學習。ReasoningBank 做出兩項關鍵改變:改為存放「推理模式」,而非「動作序列」——每個記憶都包含用於標題、描述與內容的結構化欄位;並將失敗軌跡納入學習。該框架使用模型對執行軌跡進行自我評估,將失敗經驗轉化為防陷阱規則。例如,規則「看到就點擊『載入更多』按鈕」會演變為「先驗證目前頁面識別符,避免無限捲動迴圈,然後再點擊載入更多」。

該論文也提出了具備記憶感知的測試階段縮放 (MaTTS),它會在推論期間配置額外算力,以探索多條軌跡並將發現存入記憶庫。並行擴展會為同一任務生成多條不同的軌跡,透過自我比較來強化更穩健的策略;序列擴展則以迭代方式精煉單一軌跡,並將中間推理存入記憶。

在使用 Gemini 2.5 Flash 作為 ReAct 代理的 WebArena 瀏覽任務與 SWE-Bench-Verified 編碼任務中,ReasoningBank 相較於不使用記憶的基準,WebArena 的成功率提升 8.3%,SWE-Bench-Verified 的成功率提升 4.6%,且每個任務的平均步數降低約 3。將 MaTTS 搭配並行擴展 (k=5) 進一步使 WebArena 的成功率提升 3 個百分點,並使步數再降低 0.4。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

OpenAI 招募頂級企業軟體人才,前沿代理掀起產業變革

Gate News 訊息,4 月 26 日 — OpenAI 與 Anthropic 一直在從大型企業軟體公司招募高階主管與專門工程師,包括 Salesforce、Snowflake、Datadog 與 Palantir。Denise Dresser,曾任 Salesforce 旗下 Slack 前 CEO,已加入 OpenAI 擔任首席營收官

GateNews7小時前

Worxphere 以 AI 驅動的招聘工具重新品牌化 JobKorea

Gate News 訊息,4 月 26 日——南韓人力資源平台 Worxphere 已將 JobKorea 更名,因其正從傳統線上求職看板轉向以 AI 驅動的招聘解決方案。該公司正整合包含 JobKorea 與 Albamon 在內的服務,打造一個涵蓋長期就業、零工工作與外國勞工招募的統一平台。

GateNews17小時前

AI Agent 已可獨立重現複雜學術論文:Mollick 稱錯誤多在人類原文而非 AI

Mollick 指出,公開方法與資料即可讓 AI agent 在無原始論文與程式碼情況下重現複雜研究;若重現與原論文不符,多是論文本身的資料處理錯誤或結論過度,而非 AI。 Claude 先重現論文,再由 GPT‑5 Pro 交叉驗證,多數成功,僅遇到資料過大或 replication data 問題時受阻。此趨勢大幅降低人力成本,使重現成為普遍可執行的檢驗,也提出審稿與治理的制度挑戰,政府治理工具或成關鍵議題。

鏈新聞abmedia18小時前

阿聯酋宣布:未來兩年將轉向 AI 政府模式

他的陛下謝赫·穆罕默德·本·拉希德·阿爾·馬克圖姆表示,目標是讓 50% 的政府部門透過自主型代理式 AI 運作。轉型也將包括培訓聯邦公務員以「精通 AI」,並將由謝赫·曼蘇爾·本·扎耶德監督。 重點整理:

Coinpedia04-25 08:39

AI 交易平台 Fere AI 融資 130 萬美元,由 Ethereal Ventures 領投

Gate News 消息,4月25日——Fere AI 是一個由人工智能驅動的數位資產交易平台,據 Globenewswire 報導,該平台宣布已完成一輪由 Ethereal Ventures 領投、融資金額為 130 萬美元的融資,參與方包括 Galaxy Vision Hill 與 Kosmos Ventures。 平台支援跨鏈

GateNews04-25 07:46

Nvidia 在 Blackwell 基礎設施上於整個員工隊伍部署 OpenAI Codex AI 代理

Gate News 訊息,4 月 25 日——根據 CEO Jensen Huang 與 OpenAI CEO Sam Altman 的內部通訊,Nvidia 已在成功試點後,將由 GPT-5.5 驅動的 OpenAI Codex(AI 代理)推送到其整個員工隊伍,試點規模約為 10,000 名員工。 Codex 旨在協助

GateNews04-25 03:11
留言
0/400
暫無留言