Gate News 訊息,4 月 20 日 — 根據 Databricks 的 David Meyer 表示,頂級 AI 模型擅長解決奧林匹亞數學等複雜問題,但在例行企業工作上卻力有未逮。某些模型可能會把不正確的發票編號更正掉,而不是將其標記為錯誤;而像 Claude 這樣的程式碼工具在資料工程任務上也可能同樣表現不佳。
這個落差源於企業資料與用來訓練大型模型的公開網路文字之間存在基本差異。企業資料往往包含模糊的欄位標籤、大量空白欄位,並且以純文字形式存放程式碼。在一項學術研究中,某個 AI 模型的 F1 分數(在精確率與召回率之間做平衡)從公開資料的 0.94 下降到資料工程任務中企業資料的 0.07。此外,大型模型通常會預設採用訓練期間熟悉的模式;有些模型即使在收到針對公司專有查詢語言的指示與文件後,仍預設使用結構化查詢語言 (SQL)。
透過強化學習調校的小型開源模型,能以比大型通用模型更有效率的方式處理特定工作,且訓練成本大幅降低。Databricks 正在為特定工作流程打造更小的 AI 代理,例如 KARL:它使用強化學習,透過公司的文件進行多步推理。產業正從仰賴巨型模型,轉向混合式架構:由小型且高效的模型處理例行的龐大輸入量,只有在遇到不明確或複雜的情況時,才將任務上升到更大型、成本更高的系統。
Databricks 近期收購了 Quotient AI,協助大型企業更可靠地運行 AI 代理。目前在 AI 產業中,競爭重點已轉向能否完整跑完 AI 生命週期,包括用於追蹤錯誤的回饋系統,並隨時間持續改進模型;因此,評估與調校工具在部署後變得愈發重要。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
傑夫·貝佐斯的 Project Prometheus 以 $10B 的估值募資 $38B
Gate News 消息,4 月 24 日——Project Prometheus,一家由亞馬遜創辦人傑夫·貝佐斯與前 Google 高階主管 Vik Bajaj 共同創立的 AI 實驗室,已完成一輪 $10 十億美元融資,估值達 $38 十億美元。摩根大通與貝萊德正在
GateNews38分鐘前
OpenAI 發布 GPT-5.5,專為代理任務與複雜工作流程而設計
Gate 消息,4 月 24 日 — OpenAI 已正式發布 GPT-5.5,這是一款下一代 AI 模型,旨在處理複雜目標、工具整合、自我驗證以及多步任務完成。該模型在程式碼撰寫與除錯、線上研究、資料分析、文件
GateNews54分鐘前
AI 代理新創 Band 融資 $17M 種子輪,由 Sierra Ventures、Hetz Ventures、Team8 領投
Gate News 訊息,4 月 24 日——Band 是一家為 AI 代理構建通訊與協作平台的新創公司,已完成一筆由 Sierra Ventures、Hetz Ventures 和 Team8 領投的 $17 百萬美元種子輪融資。該公司於 2025 年年中由執行長 Arick Goomanovsky 與技術長 Vlad Luzin 創立,開發用於在 AI 代理、 人類與企業系統之間進行即時協調的軟體,
GateNews1小時前
Vercel 資安外洩擴大至數百名使用者;AI 開發者風險更高
Gate News 訊息,4 月 23 日 — Vercel 在 4 月 19 日披露,其安全事件最初被描述為影響「有限的一部分客戶」,現已擴展至更廣泛的開發者社群,特別是那些正在打造 AI 代理(AI agent)工作流程的人。此次攻擊可能影響數百名使用者
GateNews5小時前
OpenAI 推 GPT-5.5:12M 脈絡、AA 指數登頂、Terminal-Bench 82.7% 改寫代理基準
OpenAI 公布 GPT-5.5,主打代理式工作與企業知識處理,並同步於 ChatGPT 與 Codex 推出。要點含 1200 萬 token 脈絡視窗、AA Intelligence Index 60,領先 Claude Opus 4.7、Gemini 3.1 Pro;價格為每百萬 token 輸入 5 美元、輸出 30 美元,輸出 token 減少約 40%,實際成本上升約 20%。
鏈新聞abmedia6小時前
MagicBlock 發布 Mirage:面向 Solana 的命令列隱私支付工具
Gate News 訊息,4月23日 — MagicBlock 已發布 Mirage,一款為 Solana 網路打造的命令列隱私支付工具。該工具讓使用者能夠透過終端機指令、機器人或 AI 代理來建立錢包、存入資金並發送私密交易。
Mirage 建置於 Private
GateNews10小時前