Nvidia GTC 2026:黄仁勋发布$1 万亿美元AI路线图 从地球到太空



Nvidia GTC 2026大会于3月16日在加州圣何塞SAP中心正式开幕,联合创始人兼首席执行官黄仁勋进行了超过两小时的压轴主题演讲。黄仁勋身着标志性皮夹克,展现了AI未来的宏大愿景,介绍了新型硬件架构、革命性软件更新以及向太空的雄心勃勃的扩展。

“智能代币”经济与$1 万亿美元展望

黄仁勋开场即重新定义了AI的发展轨迹,宣布该行业正从“模型训练时代”转向“推理时代”。他引入了“智能代币”概念,将其定位为AI经济的基本单位——每个AI生成的响应、图像或决策都代表由他所称“AI工厂”或“代币工厂”生成的一个代币。这个概念转变使数据中心从成本中心转变为创收生产设施。

这一愿景的财务规模令人震惊。黄仁勋宣布,Nvidia看到其当前和下一代系统Blackwell和Vera Rubin的采购订单总额达**$1 万亿美元(截至2027年)**。这是该公司去年预计的$500 十亿美元机会的两倍,表明尽管经济存在更广泛的不确定性,企业AI需求仍然无限。

硬件创新:Vera Rubin平台及其他

Vera Rubin AI工厂平台

硬件发布的中心是Vera Rubin平台的完整亮相,这是Nvidia在Blackwell之后的继任者。与单个芯片不同,Vera Rubin定位为完整的“AI工厂平台”,包括:

· Vera CPU:Nvidia新设计的中央处理器,专为AI工作负载构建。它的效率提升一倍,比传统CPU快50%。
· Rubin GPU:下一代图形处理器,设计用于处理万亿参数多模态模型。
· 第六代NVLink:先进的互连技术,允许数百个Rubin GPU作为一个巨大的虚拟GPU运行。
· CPO交换机:集成共封装光学(CPO)技术用光学通信取代传统铜缆,大幅降低功耗同时增加带宽。

整个平台采用液冷设计,专为“AI工厂”部署而开发,客户只需连接电源和数据即可开始AI生产。

Rubin Ultra和费曼架构

放眼更远的未来,黄仁勋预览了采用Kyber机架架构的Rubin Ultra平台——一种革命性设计,其中计算模块采用竖直堆叠以提高密度并降低延迟。Kyber将在单个机架级系统中集成144个GPU,预计于2027年推出。

更加遥远的未来,黄仁勋确认Nvidia已在开发代号为费曼(以物理学家理查德·费曼命名)的下一代架构。该架构将采用3D堆叠芯片和定制HBM内存,性能目标指向2030年。

战略性Groq整合:LPU推理引擎

最重要的宣布之一涉及Nvidia对AI推理初创公司Groq技术的整合,Nvidia于12月以约$20 十亿美元的价格获得其技术许可。这次合作产生了Nvidia Groq 3语言处理单元(LPU),现在简称为LPX推理芯片。

35倍推理速度提升

Groq 3 LPX专为低延迟推理而设计——这是AI模型实时生成响应的关键阶段。黄仁勋演示了LPX架构如何通过“解耦推理”技术与Rubin GPU配合:

· GPU处理“预填充”阶段(平行处理用户输入
· LPU处理“解码”阶段)以最小延迟按顺序生成代币

这种分工结合方式在将Groq LPU添加到Rubin系统时实现了声称的35倍每瓦代币性能提升。Groq 3 LPX机架包含256个LPU,设计用于与Vera Rubin机架并排放置在数据中心中。

黄仁勋对部署态度务实,建议对于需要最大吞吐量的工作负载,纯Vera Rubin仍然最优。但是,对于“高价值工程代币生成”及编码应用,在约25%的数据中心添加Groq LPU可提供最优性能。

LPX芯片已在三星进行量产,预计于2026年第三季度出货。

软件和AI代理:NemoClaw和开源模型

NemoClaw企业AI代理

基于已成为历史上增长最快的开源项目的开源OpenClaw现象——黄仁勋指出了这一点——Nvidia推出了NemoClaw,这是用于部署AI代理的企业就绪平台。

该平台提供完整的“参考栈”,自动下载OpenClaw并构建具有企业级安全、隐私和管理功能的生产就绪AI代理。这使Nvidia能够与OpenAI和其他云提供商在快速增长的代理AI市场中竞争。

开源模型协作

黄仁勋宣布了“Nemotron联盟”,这是与包括Mistral AI、Ai2等领先AI实验室的合作,旨在开发开源前沿模型。这一举措反映了Nvidia对开源创新的承诺,黄仁勋将其界定为AI在各行业中扩散的必要条件。

游戏和图形:DLSS 5

游戏仍是Nvidia遗产的一部分,黄仁勋为玩家带来了DLSS 5的重要更新。这项技术被描述为公司“自2018年实时光线追踪首次亮相以来计算机图形学中最重大的突破”,DLSS 5利用生成式AI实时渲染整个游戏场景。

该技术使用AI模型生成逼真的光照和材质,有效地将游戏渲染转变为AI推理问题。黄仁勋将其比作图形学的“GPT时刻”。包括卡普空、腾讯和网易在内的主要游戏发行商已承诺支持DLSS 5,该技术预计于2026年秋季推出,支持原生4K。

物理AI:自动驾驶车和机器人

自动驾驶车扩展

主题演讲在自动运输领域内容实质丰富。Uber宣布计划到2028年在四大洲28个城市部署由Nvidia Drive AV软件驱动的车队,从2027年的洛杉矶和旧金山开始。

多家主要汽车制造商承诺在Nvidia Drive Hyperion平台上构建4级自动驾驶车,包括:

· 日产
· 比亚迪
· 吉利
· 现代
· 五十铃,合作伙伴Tier IV

黄仁勋将自动驾驶车辆定性为“可能是第一个多万亿美元的机器人产业”,Nvidia提供从训练到部署的完整基础设施。

迪士尼合作:奥拉夫机器人

在一个迷人的时刻,黄仁勋与在Nvidia与迪士尼合作开发的机器人——一个来自《冰雪奇缘》的奥拉夫的机器人版本一起上台。该机器人展示了自然行走、手势和对话交互,展现了Nvidia的Isaac Sim仿真平台和Jetson Thor机器人模块。

这个演示体现了Nvidia的“物理AI”愿景——不仅处理信息而是与物理世界交互和在其中运行的AI系统。

太空探索:Space-1 Vera Rubin

也许最前沿的宣布是Space-1 Vera Rubin,一个为太空部署而设计的AI计算模块。这些模块内置能够承受极端辐射和温度条件,可安装在卫星或空间站上。

其影响深远:装备Space-1的卫星可在轨道中处理图像和传感器数据,而不是将原始数据传输到地球。一颗天气卫星可识别正在形成的飓风并直接发出警告,无需等待地面处理。黄仁勋将其描述为“构建从地球到太空的完整计算架构”。

CUDA二十周年:庆祝遗产

贯穿整个主题演讲,黄仁勋回顾了Nvidia对CUDA的20年投资,这是2006年推出的并行计算平台。从对GPU计算的冒险赌注开始,CUDA已成为整个AI行业的基础软件层。

“我们已经致力于这个架构二十年——这项革命性发明”,黄仁勋告诉观众。CUDA周年成为Nvidia长期承诺于加速计算的提醒,远早于AI成为主流现象。

市场反应和分析师观点

Nvidia股票在主题演讲期间上涨约2%,但随着投资者消化(万亿美元订单预测的规模,涨幅温和回落至1.65%的收盘。分析师建议,虽然这个数字看起来惊人,但在充分建模时可能与共识预期相符。

韦德布什证券将Nvidia的展望列为“非常看涨”,指出该公司实际上是在帮投资者框架一个到2030年AI基础设施的)万亿美元至(万亿美元的可寻址市场。摩根士丹利分析师观察到黄仁勋通过2027年的明确指引应有助于投资者对AI投资周期持续时间建立信心。

全景:AI的工业革命

黄仁勋用一个宏大的愿景作结:三年前开始的AI“iPhone时刻”已演变为全面的工业革命。生产智能代币的AI工厂将成为全球经济中与发电厂一样基础的存在。

“计算成本正在急剧下降,创新在指数级加速,”黄仁勋说。“现在是开始构建未来的最好时刻”。

GTC 2026将持续到3月19日在圣何塞进行,期间有超过1000场会议、实践培训和一场由黄仁勋主持的关于开源前沿模型的特别小组讨论(3月18日)。对于无法亲临现场的人员,会议将通过Nvidia的活动平台继续提供虚拟参与。
查看原文
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 1
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
ybaservip
· 2小时前
2026年GOGOGO 👊
查看原文回复0