OpenAI 研究人员:AI 系统或可在两年内处理大部分研究工作

Gate 新闻消息,4 月 29 日——OpenAI 的研究人员 Sébastien Bubeck 和 Ernest Ryu 表示,AI 系统可能在两年内完成大部分人类研究工作,并将数学作为衡量 AI 进展的清晰标尺。与模糊的性能测试不同,数学问题提供精确的验证:答案要么正确,要么错误,不留任何模棱两可的空间。

Bubeck 指出,真正的 AI 思考要求能够在长链推理中存活下来。在多步骤论证中出现一个错误,就会使整个证明崩塌,因此,对先进模型而言,过程中进行错误检测与修正才是终极目标。OpenAI 的内部实验室已经生成了十多项完全崭新的定理,并且可在顶级组合数学期刊发表,表明 AI 现在产出的是真正原创、具有突破性的工作,而不仅仅是将现有论文重新拼接组合。

然而,要实现持续的科学突破,就需要在数周的测试中保持稳定的专注。目前的系统仍需要严格的人类监督,以引导并核验方向每一次转变。Bubeck 用“AGI 时间”来衡量一个模型能独立模仿人类思考多久;目前系统大约在几天到一周的量级运行,而行业目标是达到数周或数月,以便在诸如生物学等领域实现自主工作。

长久记忆对于这一未来至关重要。标准的聊天窗口会限制深度——复杂的数学证明往往超过 50 页——而代码仓库则展示了更长时间的工作会话如何带来更深入的难题求解。随着 AI 获得更强的独立性与记忆,人类专业知识反而会更有价值,而不是更低。工作人员必须保留深厚的基础性知识,用以质疑并核验机器给出的答案;同时,组织也需要新的自动化过滤器与声誉系统,以便在大量由 AI 辅助的研究涌入之时维持信任。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Claude 的中文语言分词成本比英文高 65%,OpenAI 仅高 15%

Gate 新闻消息,4 月 29 日——AI 研究员 Aran Komatsuzaki 通过将 Rich Sutton 的奠基性论文《The Bitter Lesson》翻译成九种语言,对六个主要 AI 模型的分词(tokenization)效率进行了对比分析

GateNews34 分钟前

半导体分析师看好 AI 行情“至少再走三年”:先进封装才是产业瓶颈

Bubble Boi 指 AI 投資週期仍處早期,预计至少再有三年上涨,并不打算获利了结。他认为先进封装才是半导体真正瓶颈,需在同封装内整合更多HBM与更大晶片。对 NAND/Flash 看多,价格可能持续走高,未来或加入快闪供应链。个人策略是借入资金增持,并以工程实务背景理解技术细节,认为此为优势。

鏈新聞abmedia48 分钟前

AWS 在 Amazon Bedrock 中扩展对 OpenAI 的集成

亚马逊云服务(Amazon Web Services)于4月29日宣布与OpenAI的合作伙伴关系进行了重大扩展,将OpenAI最新的能力集成到其云基础设施中。该扩展为Amazon Bedrock带来了三项新的产品:OpenAI最新的模型 (limited preview),以及Codex编程

Crypto Frontier1小时前

查尔斯三世会见六位美国科技CEO(包括黄仁勋、杰夫·贝佐斯和蒂姆·库克),讨论英国初创企业融资

Gate 新闻消息,4月29日——在对美国进行国事访问期间,英国国王查尔斯三世在华盛顿的布莱尔宫会见了六位杰出的美国科技领袖:英伟达(NVIDIA)首席执行官黄仁勋、亚马逊创始人杰夫·贝佐斯、苹果首席执行官蒂姆·库克、AMD首席执行官苏姿丰、Salesforce首席执行官马克·贝尼奥夫,以及 Alphabet 总裁露思·波拉特。

GateNews1小时前

2025 年全球 AR 智能眼镜出货量激增 98%,由 Meta 的 Ray-Ban Display 和波导技术驱动

Gate 新闻消息,4 月 29 日——根据 Counterpoint Research 的数据,全球增强现实 (AR) 智能眼镜出货量在 2025 年飙升 98%,其中下半年出货量同比增长 148%。增长动力来自扩产

GateNews1小时前
评论
0/400
暂无评论