Ramp Labs 提出多智能體記憶共享新方案,Token 消耗最高降低 65%

GateNews

閘道消息,4 月 11 日,AI 基礎設施公司 Ramp Labs 發布研究成果「Latent Briefing」,透過直接壓縮大模型 KV 快取,實現多智能體系統之間的高效記憶共享;在不損失準確率的前提下,大幅降低 Token 消耗。在主流多智能體架構中,編排者(Orchestrator)將任務拆解並反覆呼叫工作者(Worker)模型,隨著推理鏈路不斷延伸,Token 用量呈指數級膨脹。Latent Briefing 的核心思路是借助注意力機制識別上下文中真正關鍵的部分,於表示層直接丟棄冗餘資訊,而非依賴速度慢的 LLM 摘要或穩定性差的 RAG 檢索。在 LongBench v2 基準測試中,該方法表現亮眼:Worker 模型 Token 消耗降低 65%,中等長度文件(32k 至 100k)的 Token 節省中位數達 49%,整體準確率較基線提升約 3 個百分點;而每次壓縮的額外耗時僅約 1.7 秒,較原始演算法提速約 20 倍。實驗以 Claude Sonnet 4 作為編排者、Qwen3-14B 作為工作者模型,涵蓋學術論文、法律文書、小說及政府報告等多種文件情境。研究還發現,最佳壓縮閾值會因任務難度與文件長度而異——難題適合採取激進壓縮以過濾投機性推理雜訊,長文件則更適合輕度壓縮以保留分散的關鍵資訊。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Nvidia 在 Blackwell 基礎設施上於整個員工隊伍部署 OpenAI Codex AI 代理

Gate News 訊息,4 月 25 日——根據 CEO Jensen Huang 與 OpenAI CEO Sam Altman 的內部通訊,Nvidia 已在成功試點後,將由 GPT-5.5 驅動的 OpenAI Codex(AI 代理)推送到其整個員工隊伍,試點規模約為 10,000 名員工。 Codex 旨在協助

GateNews3小時前

AI 編碼新創 Cognition 洽談 $25B 估值以進行融資回合

Gate 新聞訊息,4 月 25 日——根據熟悉此事的人士表示,AI 編碼新創 Cognition 正處於初步洽談階段,計劃籌集數億美元或以上資金,估值約為 $25 billion。自 SpaceX 收購一家競爭型 AI 編碼新創之後,市場興趣有所上升。 Co

GateNews4小時前

AI 交易代理平台 Fere AI 融資 130 萬美元,Ethereal Ventures 領投

Gate News 訊息,4 月 25 日——AI 驅動的數位資產交易代理平台 Fere AI 宣布完成一輪 130 萬美元的融資,由 Ethereal Ventures 領投,Galaxy Vision Hill 和 Kosmos Ventures 參與。本平台支援跨鏈網路,包括以太坊,

GateNews5小時前

OpenClaw v2026.4.23 新增 gpt-image-2 直接 OAuth 支援,並為子代理引入分叉式上下文模式

Gate 新聞訊息,4 月 25 日 — OpenClaw,一個開源 AI 代理框架,在 4 月 23 日發布了 v2026.4.23,涵蓋影像生成、子代理機制以及安全加固等多項更新。 影像生成增強使得 gpt-image-2 可直接透過 Codex OAuth 呼叫,且不必

GateNews5小時前

Fere AI 完成由 Ethereal Ventures 領投的 130 萬美元融資

Gate News 訊息,4月24日——Fere AI,一個由人工智慧驅動的數位資產交易代理平台,宣布完成一輪由 Ethereal Ventures 領投的 130 萬美元融資,並有 Galaxy Vision Hill 與 Kosmos Ventures 參與。 該平台支援跨鏈網路,包括 Ethereum,

GateNews16小時前
留言
0/400
暫無留言