根據 Beating 監控到的 OpenAI 官方公告，該公司將即日起停止其面向開發者的自助式微調 API。新使用者將不再能夠建立微調任務，而現有的活躍使用者則可在 2027 年 1 月 6 日之前繼續存取該服務。已部署的微調模型，其推論服務將與其基礎模型的生命週期綁定；當基礎模型下架時，推論服務也將停止。

OpenAI 表示，其新的基礎模型（例如 GPT-5.5）在遵循指令與格式化方面已足夠強大。該公司指出，將提示工程與檢索增強生成（Retrieval-Augmented Generation，RAG）結合使用，比微調更便宜、更快速，且足以滿足多數使用情境。

View Source

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

Anthropic Code Mode 解 MCP Vs CLI 之爭：工具住 Runtime、tokens 從 150K 壓到 2K

AI 行業動態

本文梳理 2025 年 MCP 與 CLI 的爭論，引用 Anthropic 的 Code Mode：改變工具呼叫的角色定位，讓模型寫程式碼並由 runtime 呼叫工具，工具細節在 runtime，型別與 API 透過 import 自動對齊。這樣把 token 從 150K 壓到約 2K，顯著提升效能與可擴展性；雖然 MCP 並未死，核心教訓是避免在 session context 一次性載入所有工具，讓 runtime 處理細節。

鏈新聞abmedia56分鐘前

字節跳動計劃今年在 AI 基礎設施支出上增加 25%，達 2000 億人民幣

AI 行業動態

根據 ChainCatcher 引述 Golden Data 的說法，字節跳動計劃在今年將 AI 基礎設施支出提高 25%，至 2000 億人民幣，推動因素包括記憶體晶片成本上升以及人工智慧發展加速。

GateNews1小時前

企業級 AI 平台 Pit 關閉 $16M 期融資，由 a16z 領投

AI 行業動態

根據 Odaily，企業級 AI 平台 Pit 宣布完成一輪 1,600 萬美元的融資，由 a16z 領投，Lakestar 參與，並有來自 OpenAI、Anthropic、Google、Deel 和 Revolut 的高管加入。Pit 將自己定位為「AI 產品團隊作為服務」（AI product team as a service），旨在取代傳統試算表以及僵化的 SaaS 系統。

GateNews1小時前

Google 導入試行徵才考試，讓工程師可使用 AI 工具

AI 行業動態

根據《朝鮮日報》（The Chosun Daily），Google 正在試行一種招聘考試，讓美國的軟體工程師應試者在特定的初階與中階職位中可使用 AI 工具。該試驗包含程式碼理解任務，應徵者需要檢視既有程式碼、修正錯誤並提升效能。面試官將評估候選人如何提示 AI、檢查其輸出、編輯結果並除錯程式碼，而非僅評量其從零開始撰寫程式碼的能力。

GateNews3小時前

Sakana AI 與 Nvidia 透過跳過 80% 的無效運算，使 H100 推論速度提升 30% 更快

AI 行業動態

Sakana AI 和 Nvidia 已開源 TwELL，這是一種稀疏資料格式，可讓 H100 GPU 在大型語言模型中跳過 80% 的無效運算，同時不犧牲準確性。該解決方案在 H100 上可提供最高 30% 更快的推論速度，以及 24% 更快的訓練速度，同時降低峰值記憶體使用量。在 1.5 十億參數模型的測試中，透過訓練期間使用輕量化正則化，該方法將作用中的神經元降至低於 2%，且在七項下游任務中沒有出現效能退化。

GateNews5小時前

Microsoft 將 Phi-Ground 4B 模型開源，表現優於 OpenAI Operator 與 Claude 的點擊螢幕準確率

AI 行業動態

根據 Beating，Microsoft 最近開源了 Phi-Ground 模型家族，該家族旨在解決「AI 應該在電腦螢幕的哪裡點擊」這個問題。這個 40 億參數版本，並搭配用於指令規劃的大型語言模型，在 Showdown 基準測試中超越了 OpenAI Operator 與 Claude Computer Use 的點擊精度，並在包含 ScreenSpot-Pro 的五項評估中，於所有低於 100 億參數的模型中排名第一。團隊以超過 4,000 萬筆資料樣本進行訓練，並發現學術論文中常用的三種訓練技術在規模化後變得無效。關鍵方法證實其實很簡單：輸出座標作為一般數字，例如「523, 417」。先前的研究為座標發明了專用位置詞彙，但這些方法無法擴展到更大規模。團隊也發現，將文字指令放在影像之前能提升效能，因為模型在處理像素時就能辨識目標。此外，像 DPO 這類強化學習方法，即使在微調之後也能提升準確度。

GateNews5小時前

留言

0/400

专业以太短线多空

· 2小時前

抄底進場 😎

查看原文回復0

专业以太短线多空

· 2小時前

衝衝GT 🚀

查看原文回復0

专业以太短线多空

· 2小時前

衝衝GT 🚀

查看原文回復0

专业以太短线多空

· 2小時前

衝衝GT 🚀

查看原文回復0

专业以太短线多空

· 2小時前

衝衝GT 🚀

查看原文回復0

专业以太短线多空

· 2小時前

衝衝GT 🚀

查看原文回復0