OpenAI Engineer Clive Chan Challenges V4 Hardware Recommendations, Citing Errors and Vagueness vs. V3

Gate News message, April 24 — OpenAI engineer Clive Chan has raised detailed objections to the hardware recommendations chapter in the V4 technical report, calling it “surprisingly mediocre and error-prone” compared to the acclaimed V3 version. V3’s hardware guidance, which included Q&A sessions that became the most popular discussion topic at the ISCA academic conference, offered specific recommendations aligned with industry interconnect standards. V4, by contrast, is far more vague.

Chan systematically challenged three key recommendations. On power consumption, the report suggests that software optimization allows chips to run compute, storage, and communication at full capacity simultaneously, and recommends that chip manufacturers reserve additional power headroom. Chan argues this is counterproductive: total chip power is constrained by physical process limitations, so reserving more power margin only reduces operating frequency, ultimately decreasing computational performance. Regarding GPU-to-GPU data transfer, the report advocates a pull model—where GPUs actively fetch data—over a push model, citing high notification overhead in push operations. Chan disputes this, contending that pull is actually slower and that improved network adapter capabilities would be preferable. However, the two may be discussing different layers of the issue: the report addresses notification mechanism overhead, while Chan refers to transmission latency itself.

On activation functions, the report recommends replacing SwiGLU with simpler functions to reduce computational burden. Chan sees no merit in this, noting that Sonic MoE has already demonstrated optimal performance using SwiGLU. Chan suspects DeepSeek may have “deliberately weakened this section.”

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

DeepSeek 以 $20B 估值尋求 18 億美元融資,伴隨人才外流

Gate 新聞訊息,4月25日——據知情人士稱,DeepSeek 正計劃籌集 18 億美元,對該公司估值約為 $20 billion。此次融資之所以啟動,是因為這家 AI 新創公司面臨顯著的人才流失,多位核心研究人員已離職,準備加入字節跳動、騰訊、小米,以及自動駕駛公司 Horizon Robotics。

GateNews4小時前

法官駁回 Elon Musk 在其 OpenAI 訴訟中的詐欺指控;案件將隨兩項剩餘指控進入審判

Gate News 訊息,4 月 24 日——一名聯邦法官駁回了 Elon Musk 針對 OpenAI、Sam Altman、Greg Brockman 與 Microsoft 提出的訴訟中的詐欺指控,為案件就剩下的兩項指控進入審判鋪平道路:違反慈善信託與不當得利。美國。

GateNews7小時前

OpenAI執行長山姆·奧特曼為未向警方通報校園槍手的被封禁帳號道歉

閘門新聞訊息,4月25日——OpenAI首席執行官山姆·奧特曼向加拿大Tamborine社區道歉,因為該公司未能就與Jesse Van Rootselaar相關的被封禁帳號通知警方;該名人士於2月在一所學校殺害8人後自盡。OpenAI

GateNews8小時前

阿聯酋宣布:未來兩年將轉向 AI 政府模式

他的陛下謝赫·穆罕默德·本·拉希德·阿爾·馬克圖姆表示,目標是讓 50% 的政府部門透過自主型代理式 AI 運作。轉型也將包括培訓聯邦公務員以「精通 AI」,並將由謝赫·曼蘇爾·本·扎耶德監督。 重點整理:

Coinpedia8小時前

AI 交易平台 Fere AI 融資 130 萬美元,由 Ethereal Ventures 領投

Gate News 消息,4月25日——Fere AI 是一個由人工智能驅動的數位資產交易平台,據 Globenewswire 報導,該平台宣布已完成一輪由 Ethereal Ventures 領投、融資金額為 130 萬美元的融資,參與方包括 Galaxy Vision Hill 與 Kosmos Ventures。 平台支援跨鏈

GateNews9小時前

Google 加碼 400 億美元投資 Anthropic:先付 100 億、再依業績釋放 300 億,配 5GW TPU 算力

Alphabet 對 Anthropic 加碼至 400 億美元,分兩階段:首筆 100 億美元現金注入、估值 3,800 億美元;剩餘 300 億美元於業績達標後分階段釋放。Google Cloud 五年內提供 5 GW TPU 計算資源;同期 Amazon 也宣布最高 250 億美元投資,顯示 Anthropic 的算力與資本支援同步增強。

鏈新聞abmedia10小時前
留言
0/400
暫無留言