封鎖新聞訊息,4 月 23 日 — Perplexity 的研究團隊發布了一篇技術文章,詳述其用於 Web 搜尋代理的後訓練方法。該方法使用兩個開源的 Qwen3.5 模型 (Qwen3.5-122B-A10B 與 Qwen3.5-397B-A17B),並採用兩階段流程:先進行監督式微調 (SFT) 以建立遵循指令與語言一致性,接著透過線上強化學習 (RL) 以最佳化搜尋準確性與工具使用效率。
RL 階段使用 GRPO 演算法,且有兩種資料來源:一個專有的多跳可驗證問答資料集,係由內部種子查詢構建而成,要求推理 2–4 個跳步,並透過多解算器驗證;以及基於規則量表的通用對話資料,將部署需求轉換為可客觀檢查的原子條件,以防止 SFT 行為退化。
獎勵設計採用閘控聚合——只有在達到基準正確性時((question-answer match))或所有規則量表準則均滿足時,偏好分數才會被計入,以避免高偏好訊號掩蓋事實錯誤。效率懲罰則使用同組錨定,對超出同組中正確答案基準的工具呼叫與生成長度套用平滑懲罰。
評估顯示 Qwen3.5-397B-SFT-RL 在各類搜尋基準上達到業界一流的表現。在 FRAMES 上,單次工具呼叫可達 57.3% 準確率,較 GPT-5.4 高出 5.7 個百分點,並較 Claude Sonnet 4.6 高出 4.7 個百分點。在中等預算 (four tool calls) 下,它以每次查詢 $0.02 達到 73.9% 準確率;相比之下,GPT-5.4 為 67.8%(每次查詢 $0.085),Sonnet 4.6 為 62.4%(每次查詢 $0.153)。成本數據基於各供應商的公開 API 定價,且不包含快取最佳化。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
AI 交易代理平台 Fere AI 融資 130 萬美元,Ethereal Ventures 領投
Gate News 訊息,4 月 25 日——AI 驅動的數位資產交易代理平台 Fere AI 宣布完成一輪 130 萬美元的融資,由 Ethereal Ventures 領投,Galaxy Vision Hill 和 Kosmos Ventures 參與。本平台支援跨鏈網路,包括以太坊,
GateNews50分鐘前
OpenClaw v2026.4.23 新增 gpt-image-2 直接 OAuth 支援,並為子代理引入分叉式上下文模式
Gate 新聞訊息,4 月 25 日 — OpenClaw,一個開源 AI 代理框架,在 4 月 23 日發布了 v2026.4.23,涵蓋影像生成、子代理機制以及安全加固等多項更新。
影像生成增強使得 gpt-image-2 可直接透過 Codex OAuth 呼叫,且不必
GateNews56分鐘前
Fere AI 完成由 Ethereal Ventures 領投的 130 萬美元融資
Gate News 訊息,4月24日——Fere AI,一個由人工智慧驅動的數位資產交易代理平台,宣布完成一輪由 Ethereal Ventures 領投的 130 萬美元融資,並有 Galaxy Vision Hill 與 Kosmos Ventures 參與。
該平台支援跨鏈網路,包括 Ethereum,
GateNews11小時前
大型 CEX 錢包在促銷期間推出零費用的 Agentic Wallet,供 AI 代理使用
Gate 新聞消息,4 月 24 日 — 一家主要加密貨幣交易所錢包已推出 AgenticWallet,一款專為 AI 代理設計的無密鑰專用錢包。該平台使用戶能夠授權 AI 代理在已設定的條件下,安全地執行交易、轉帳和資產管理操作
GateNews13小時前
Web3 AI 基礎設施 AIW3 完成由 Buffalo Capital 領投的 $2M 種子輪融資
Gate 新聞訊息,4 月 24 日——Web3 AI 基礎設施平台 AIW3 宣布完成一筆 $2 百萬種子輪融資。該輪由 Buffalo Capital 領投,並由 GalaXin Capital 與 Three-stones Ventures 作為共同投資方參與。
AIW3 正在轉向「代理即服務」(Agent-as-a-Service)
GateNews15小時前