OpenAI 工程师 Clive Chan 挑战 V4 硬件建议,称其相较 V3 存在错误与模糊之处

Gate News 消息,4 月 24 日——OpenAI 工程师 Clive Chan 就 V4 技术报告中的硬件建议章节提出了详细异议,称其“出人意料地平庸且容易出错”,与备受赞誉的 V3 版本相比尤为如此。V3 的硬件指导,其中包括问答(Q&A)环节,这些环节成为 ISCA 学术会议上最受欢迎的讨论话题,并提供了与业界互连标准相匹配的具体建议。相比之下,V4 则要模糊得多。

Chan 系统性地质疑了三项关键建议。关于功耗,报告指出,软件优化允许芯片在同一时间以满负荷运行计算、存储与通信,并建议芯片制造商预留更多的功率余量。Chan 认为这适得其反:芯片的总功耗受物理工艺限制所约束,因此预留更大的功耗裕量只会降低工作频率,最终减少计算性能。关于 GPU 到 GPU 的数据传输,报告主张采用拉取(pull)模型——由 GPU 主动获取数据——而非推送(push)模型,并称在推送操作中存在较高的通知开销。Chan 则对此提出异议,认为拉取实际上更慢,并且更优的是提升网络适配器能力。然而,这两者可能在讨论问题的不同层面:报告谈的是通知机制的开销,而 Chan 指的是传输延迟本身。

关于激活函数,报告建议用更简单的函数来替换 SwiGLU,以降低计算负担。Chan 认为这没有任何价值,并指出 Sonic MoE 已经通过使用 SwiGLU 展示了最佳性能。Chan 怀疑 DeepSeek 可能“故意削弱了这一部分。”

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

中国 NDRC 指示包括 Moonshot 和 StepFun 在内的 AI 公司在未获批准前拒绝美国资本

Gate News 消息,4 月 25 日——据彭博援引知情人士称,中国国家发展和改革委员会 (NDRC) 在最近几周已指示多家 AI 公司拒绝美国资本,除非它们获得明确的政府批准。正在准备 IPO 上市的 Moonshot AI 和 StepFun 都已收到 NDRC 的指导。字节跳动也被指示在事先获得授权之前,不得通过二级股份转让或其他方式引入新的美国投资者。

GateNews35 分钟前

美国法官驳回马斯克针对 OpenAI 和奥特曼的欺诈指控

Gate 新闻消息,4月25日——美国一名法官驳回了埃隆·马斯克在其针对该公司的持续诉讼中,针对 OpenAI 及其联合创始人山姆·奥特曼提出的欺诈指控。 法院已裁定,欺诈指控不会继续推进,不过法官已安排了额外听证会,以处理马斯克在本案中其余的指控

GateNews55 分钟前

英特尔的利多消息为何带动辉达股票飙涨?

英特尔本季财报EPS0.29美元、营收136亿美元双双超预期,数据中心与运算设备更新动能回升,提振半导体与AI需求信心。此利多带动辉达股价中午上涨约4.9%,市场认为基础算力需求仍旺,降低AI泡沫化担忧,并支持辉达长期增长预期。两者竞争同时出现正向板块联动。

鏈新聞abmedia5小时前

中国与美国就模型蒸馏指控及投资限制展开AI对决

Gate News消息,4月24日——中国已驳斥美国指控,称其科技巨头正通过工业级蒸馏剥削美国AI技术;与此同时,两国正为在AI开发和投资控制方面发生重大冲突而做准备。特朗普政府正在准备

GateNews7小时前

Alphabet拟向Anthropic投资最高$40 十亿美元,推动AI竞争

Gate News消息,4月24日——Alphabet(谷歌的母公司)计划向AI开发商Anthropic投资最高$40 十亿美元,包括$10 十亿美元的预付款以及$30 十亿美元的额外融资,条件是达到特定的绩效里程碑。此次投资是在Alphabet此前持有Anthropic 14%的股份之后进行的。

GateNews9小时前

瑞士监管机构 FINMA 警告:Anthropic 的 Mythos AI 工具存在金融风险

Gate News 消息,4 月 24 日 — 瑞士金融市场监管局 (FINMA) 表示,允许银行快速且方便地采用 Anthropic 的人工智能工具 Mythos 将带来严重风险。该

GateNews9小时前
评论
0/400
暂无评论