GPT-5.4 Mini 上線!運行速度翻倍,小模型更具實用度

Market Whisper

GPT-5.4 Mini上線

OpenAI 於 3 月 18 日發布 GPT-5.4 Mini 與 GPT-5.4 Nano,兩款專為高容量 AI 工作負載設計的輕量模型,在 GPT-5.4 旗艦版發布不到兩週後再次迭代。GPT-5.4 Mini 速度較前代 GPT-5 Mini 快兩倍,GPT-5.4 Nano 則以更低成本針對即時對話場景優化。

小模型的核心邏輯:準確性並非永遠是瓶頸

OpenAI 將 GPT-5.4 Mini 與 Nano 定位為「迄今功能最強大的小型模型」,但這並非旗艦版的縮水品。它們是基於不同優先順序的設計選擇:當任務的實際瓶頸是速度與成本,而非推理深度時,更小的模型往往更具實用性。

以客服系統為例:若每天回答固定的 200 個問題,博士級推理能力的邊際收益幾乎為零,而每次響應不到一秒、每次回覆僅需幾分之一美分的成本,才是系統能否規模化的關鍵。

目前一個較為高效的工作流程架構是:讓旗艦模型(如 GPT-5.4)負責任務規劃與協調,Mini 或 Nano 則並行處理大量重複性子任務——例如代碼庫搜尋、文件讀取或表單處理。Perplexity 副首席技術長 Jerry Ma 在測試後表示:「Mini 模型推理能力強,而 Nano 模型響應迅速且高效,適用於即時對話工作流程。」

基準測試數據:Mini 已超越人類電腦操作基準

OSWorld-Verified測試 (來源:OpenAI)

從公開基準數據看,GPT-5.4 Mini 的表現已相當接近旗艦:

SWE-Bench Pro(評估修復 GitHub 實際程式碼問題的能力):GPT-5.4 Mini 得分 54.4%;舊版 GPT-5 Mini 為 45.7%;GPT-5.4 旗艦版為 57.7%

OSWorld-Verified(透過螢幕截圖評估實際操作桌面的能力):Mini 得分 72.1%;GPT-5.4 旗艦版為 75.0%;人類基準線為 72.4%——Mini 已超越人類基準

GPT-5.4 Nano:SWE-Bench Pro 52.4%、OSWorld-Verified 39.0%,低於 Mini,但較前代 Nano 系列仍是重大進步

這組數據說明:在需要操作桌面或處理代碼的場景,Mini 的表現幾乎與旗艦版並駕齊驅;Nano 雖準確性較低,但在即時性要求高的場景仍具有獨特的成本效益優勢。

定價結構與可用性:開發者 vs 一般用戶的不同入口

API 定價:GPT-5.4 Mini 每百萬輸入 Token $0.75,每百萬輸出 Token $4.50;GPT-5.4 Nano 每百萬輸入 Token $0.20,每百萬輸出 Token $1.25——Nano 輸入定價約為 Mini 的四分之一。

使用者可用性:GPT-5.4 Mini 已向 ChatGPT Free 及 Go 方案用戶開放,可透過「+」選單的「思考」選項存取;付費用戶達到 GPT-5.4 使用頻率上限時,系統將自動切換至 Mini。GPT-5.4 Nano 目前僅提供 API 存取,定位為開發者工具,不直接面向消費者。

常見問題

GPT-5.4 Mini 與 GPT-5.4 旗艦版的主要差異是什麼?

GPT-5.4 Mini 在速度上比前代 GPT-5 Mini 快兩倍以上,在 OSWorld-Verified 測試中得分 72.1%,已超越人類 72.4% 的基準線,僅略低於旗艦版的 75.0%。主要差異在推理深度與複雜任務的處理能力,而 Mini 的速度與成本優勢使其在大量重複性任務中更具實用性。

GPT-5.4 Nano 的最佳使用場景是什麼?

GPT-5.4 Nano 定位為 API 開發者工具,最適合需要即時回應的輕量對話工作流程,例如即時客服系統或每日大規模自動化查詢。其輸入定價每百萬 Token 僅 $0.20,使新創公司大規模部署在經濟上具有可行性。

如何在 ChatGPT 中使用 GPT-5.4 Mini?

GPT-5.4 Mini 目前向 ChatGPT Free 及 Go 方案用戶開放,可於 ChatGPT 介面「+」選單的「思考」選項存取。付費用戶在達到 GPT-5.4 使用頻率限制時,系統將自動切換至 Mini 版本。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明
留言
0/400
暫無留言