Anthropic宣布解鎖Opus 4.6百萬Token不加價!上下文測試碾壓GPT-5.4

動區BlockTempo

Anthropic 宣布 Claude Opus 4.6 與 Sonnet 4.6 的百萬 Token 上下文視窗正式 GA,定價維持不變;長上下文測試 MRCR v2 中,Opus 4.6 以 78.3% 大幅領先 GPT-5.4(36.6%)與 Gemini 3.1 Pro(25.9%)。
(前情提要:Claude Opus 4.6 來了:自己寫編譯器、做 PPT、隨手挖出 500 個零日漏洞,你的工作它都想試試)
(背景補充:Google 的 Gemini 3 Deep Think 大升級:推理能力強壓 Opus 4.6、GPT-5.2,要做「最會科研的 AI」)

Anthropicn 正式宣布,旗下 Claude Opus 4.6 與 Claude Sonnet 4.6 的百萬 Token 上下文視窗(1M Token Context Window)已從 Beta 階段全面升為正式版(GA),即日起向所有使用者開放,且定價不做任何調整。

此次 GA 最大亮點在於「不加價」。Opus 4.6 維持輸入 $5、輸出 $25(每百萬 Token),Sonnet 4.6 則維持輸入 $3、輸出 $15,且從第 1 個到第 100 萬個 Token 採用統一單價,不設分層計費。

用來寫程式的開發者可以一次塞進更大的程式庫的原始碼、數百頁研究報告,或長篇合約檔案。

MRCR v2 基準測試:Opus 4.6 大幅領先對手

Anthropic 同步公布長上下文能力的基準測試結果,採用 MRCR v2 評估框架,測試模型在超長文字中的資訊檢索與推理能力:

  • Claude Opus 4.6:78.3%
  • GPT-5.4:36.6%
  • Gemini 3.1 Pro:25.9%

Opus 4.6 得分幾乎是 GPT-5.4 的兩倍以上,遠超 Google Gemini 3.1 Pro。這對要處理超長合約、法律檔案、大型程式碼庫或多輪對話記錄的企業使用者,相當有價值。

Gemini 系列雖以支援 200 萬 Token 的超長上下文著稱,但 MRCR v2 的結果顯示,視窗「容量」與實際「理解品質」之間仍存在明顯落差,Anthropic 顯然希望以此區隔競爭對手。

Claude Code 整合程式庫分析、600 頁 PDF 單次處理

在應用層面,百萬 Token 上下文已在開發者工具 Claude Code 中全面啟用。官方強調,這能大幅緩解大型程式庫分析與日誌(log)檢索時的上下文壓縮問題,開發者無需再手動切割輸入或擔心重要資訊被截斷。

包括單次請求最多可處理 600 張圖片,或 600 頁 PDF 檔案。對需要對照大量技術檔案、審查長篇稽核報告,或一次性分析整個開源專案原始碼的場景。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论