Gate News 消息,4 月 24 日 — V4 已公開披露其 V4-Pro 模型的內部自我測試(dogfooding)數據。該公司從超過 50 位工程師收集了約 200 項真實世界的工程任務,涵蓋功能開發、錯誤修復、重構以及跨技術棧的診斷,包括 PyTorch、CUDA、Rust 和 C++。經過嚴格篩選後,保留了 30 項任務用於基準評估。
V4-Pro-Max 的程式通過率達到 67%,顯著超越 Sonnet 4.5 的 47%,並接近 Opus 4.5 的 70%。不過,它仍落後於 Opus 4.5 Thinking (73%) 與 Opus 4.6 Thinking (80%),同時遠高於 Haiku 4.5 的 13%。
在一項包含 85 位受訪者的內部調查中,所有參與者都表示在日常工作流程中使用 V4-Pro 進行具代理(agentic)的程式編寫。52% 將 V4-Pro 作為其預設的主要程式模型,39% 傾向於表示批准,而不到 9% 表達不認同。回報的問題包括底層錯誤、對含糊指令的誤解,以及偶爾出現過度思考的行為。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
印度在班加羅爾推出 $650M AI 城市項目,目標到 2030 年吸引 25,000 名研究人員
Gate News 訊息,4月27日——印度正在班加羅爾打造一座 $650 百萬美元的 AI 城市,配備占地 500,000 平方英尺的設施,旨在成為全球首個用於代理式 AI(agentic AI)的實體實驗室。該項目提供對四家主要 AI 雲端供應商的 400 Gbps 連接能力,並計劃
GateNews6分鐘前
Sam Altman 概述 OpenAI 的五項營運原則,暗示為安全可能對模型能力的存取進行未來限制
Gate News 消息,4 月 27 日——OpenAI 執行長 Sam Altman 以其個人署名發布了公司五項營運原則,暗示 OpenAI 可能在特定時期限制用戶對模型能力的存取,以優先考量安全。在該聲明中,Altman 描述了一個潛在的未來情境:
GateNews1小時前
DeepSeek 推遲 V4 上市以針對華為的 Ascend 晶片進行優化
門戶新聞訊息,4月27日——DeepSeek 推遲了其 V4 模型的發布,以微調其軟體堆疊來適配華為的 Ascend 晶片,反映北京更廣泛的舉措:在取得先進外國半導體的途徑日益受限之際,打造本土 AI 供應鏈。
DeepSe
GateNews1小時前
DeepSeek 將輸入快取價格砍至上線價的 1/10;V4-Pro 降至每 100 萬 tokens 0.025 元人民幣
Gate News 訊息,4 月 26 日 — DeepSeek 已在其整個模型產品線中將輸入快取價格下調至上線價格的 1/10,立即生效。V4-Pro 模型提供限時 2.5 倍折扣優惠,活動將持續至 2026 年 5 月 5 日 23:59(UTC+8)。
Following both re
GateNews11小時前
OpenAI 招募頂級企業軟體人才,前沿代理掀起產業變革
Gate News 訊息,4 月 26 日 — OpenAI 與 Anthropic 一直在從大型企業軟體公司招募高階主管與專門工程師,包括 Salesforce、Snowflake、Datadog 與 Palantir。Denise Dresser,曾任 Salesforce 旗下 Slack 前 CEO,已加入 OpenAI 擔任首席營收官
GateNews11小時前
百度千帆推出對 DeepSeek-V4 的第 0 天支持,並提供 API 服務
Gate News 消息,4 月 25 日——DeepSeek-V4 預覽版已於 4 月 25 日上線並開源,並由百度智能云旗下的百度千帆平台提供第 0 天(Day 0)API 服務適配。該模型具備百萬級 token 的擴展上下文窗口,並提供兩個版本:DeepSeek-V4
GateNews17小時前