OpenClaw 創始人分享 AI 模型適配率排名,國產 minimax-m2.1 和 kimi-k2.5 分列 2、3 位

Gate News 消息,3 月 8 日,OpenClaw(AI 代理開發框架)創始人 Peter Steinberger 轉發第三方機構 PinchBench 基準測試結果,該測試評估 AI 大語言模型在 OpenClaw 代理任務中的表現。結果顯示,Gemini 3 Flash 處理 OpenClaw 任務成功率以 95.1% 位居第一,國產模型 minimax-m2.1 和 kimi-k2.5 分別以 93.6% 和 93.4% 位列第 2、3 位。Claude Sonnet 4.5 成功率為 92.7%,GPT-4o 為 85.2%。

查看原文
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言