3月23日,国家数据局局长刘烈宏在中国发展高层论坛上公布了一组震撼数据:中国日均AI Token调用量已从2024年年初的1000亿,跃升至2025年底的100万亿,并在2026年3月突破140万亿,两年增长超千倍。与此同时,全球最大AI模型API聚合平台OpenRouter的数据显示,中国大模型的周调用量已连续数周超越美国,全球调用量前三的位置被中国模型包揽。一场由Token驱动的产业革命,正以前所未有的速度重构全球科技竞争格局、商业模式乃至国家核心竞争力。
2026年初,硅谷也传来多条引发全球科技界关注的行业动态。OpenAI内部正逐步放弃沿用近20年的互联网核心指标DAU(日活跃用户数),转而将TPD(Token Per Day,每日Token消耗量)作为核心经营指标。这一转变绝非偶然。英伟达CEO黄仁勋在GTC 2026大会上,将数据中心重新定义为“Token工厂”,指出未来的竞争核心是“每瓦Token吞吐量”。这并非孤立现象,而是标志着以Token为核心计量和交易单位的智能经济新范式已全面降临。
从计算机科学的角度来看,Token是AI模型处理各类信息的基本单元。当一段文本输入模型时,它会被拆解为单词或子词;一张图片会被分解为像素块;一段音频会被切分为时间片段。这些不可再分的基本单元,均可称为Token。
在实际应用中,Token的计量遵循一定的规则。对于英文文本,一个短单词可能仅算作一个Token,而较长的单词则会被拆解成多个Token;一个简单的经验法则是:1个Token大约等于4个英文字符。对于中文文本,通常一个汉字对应1到2个Token。无论是模型训练过程中的数据处理,还是模型服务调用中的功能输出,AI的每一项核心动作,都以Token为核心计量尺度。Token的消耗规模直接反映模型的工作量与价值产出,符合马克思的劳动价值论。
Token的突出贡献在于,它为智能经济的发展提供了可量化、可对比的价值尺度。在AI技术从文本模态向多模态迭代、应用场景向编程、视频、科研等领域深化的过程中,Token作为“统一度量衡”的战略定位日益凸显。这一定位并非凭空产生,而是产业发展的必然结果:工业时代需要“千瓦时”来计量电力消耗,互联网时代需要“GB”来计量数据流量,AI时代自然需要Token来计量智能产出。在经济与商业层面,Token已成为智能时代可计量、可定价、可交易的核心价值单元。它连接着底层的能源、算力、数据与顶层的智能服务,是衡量AI生产力、核算AI成本、进行AI服务结算的通用标尺。
Token的价值链涵盖硬件制造、基础设施建设、算力提供、平台运营、应用开发五大环节。其成本构成中,电力与算力折旧合计占比高达70%-80%,成为决定Token国际竞争力的核心要素。“每瓦特Token吞吐量”(Tokens per Watt)成为衡量AI企业竞争力的核心指标。这意味着在固定的电力预算下,谁能以更高的能源效率生产更多Token,谁就拥有最低的生产成本和最强的市场竞争力。
随着应用场景的极度丰富,Token计量方法已从早期的简单计数进化为多维度、动态加权的复杂体系。
(1)输入与输出的二元分化。最基础的计量依然遵循“输入Token”与“输出Token”的二元结构。输入Token代表用户向模型提供的信息量(包括提示词、上传的文档、历史对话记录等),而输出Token则是模型生成的响应内容。在商业计费中,由于生成过程需要消耗大量的显存带宽和计算周期,输出Token的成本通常是输入Token的3至5倍。这种价格差异反映了“创造性劳动”与“信息读取”在算力消耗上的本质区别。
(2)上下文计量与记忆成本。2024年至2025年,大模型的上下文窗口(Context Window)经历了从8K、32K到128K乃至1M(百万级)的飞跃。在2026年,处理超长上下文已成为常态。然而,长上下文并非免费午餐。基于Transformer架构的注意力机制(Attention Mechanism)使得处理长序列的计算复杂度往往呈二次方或线性增长。因此,现代计量体系引入了“上下文加权系数”。当用户在一个拥有100万Token上下文的会话中进行提问时,即使只生成了10个Token的回答,系统也需要重新扫描或检索庞大的历史记忆,这部分隐性消耗被计入“活跃上下文Token”成本中。这使得计量更加精准地反映了模型维持长期记忆的资源代价。
(3)多模态数据的Token化。随着多模态大模型(LMM)的成熟,图像、视频和音频也被纳入了Token计量体系。一张高分辨率图片不再被视为单一文件,而是被切割成数百个视觉补丁(Visual Patches),每个补丁被编码为一个或多个视觉Token。一段1分钟的视频可能转化为数万个时序视觉Token。这种统一计量法打破了模态壁垒,使得看图说话、视频理解和语音交互都能在同一套经济模型下进行核算。例如,生成一段10秒的高清视频,其消耗的Token数量可能相当于撰写一篇千字文章,这直观地体现了不同模态信息密度的差异。
(4)Token价值的隐形化。随着AI Agent(智能体)的普及,模型不再仅仅进行单次回答,而是进行复杂的自主规划、代码执行、自我反思和多轮搜索。这一过程产生了大量的中间思维Token,这些Token并不直接展示给用户,却是高质量输出的基石。新的计量标准开始区分“表面输出Token”和“内部推理Token”。对于高难度的科学计算或复杂逻辑推理,内部推理Token的数量可能是最终输出的几十倍。部分先进平台已开始尝试按有效推理步数或思维链深度进行差异化计费,标志着计量体系从“计字数”向“计智力”的根本转变。
近年来,AI Token的发展呈现出三大核心趋势:总量的指数级爆发、单位的极致压缩以及价值的分层固化。
趋势一:消耗量的核爆式增长。据统计,2024年全球日均Token消耗量约为1000亿级别,而到了2026年第一季度,这一数字已飙升至180万亿,增长了近1800倍。这一增长并非线性叠加,而是源于应用范式的质变。早期的Token消耗主要来自人机对话(Chatbot),属于低频、浅层交互;而2026年的主流应用是自主智能体(Autonomous Agents)。一个Agent在执行任务时,会自主拆解目标、调用工具、编写并调试代码、验证结果,这一闭环过程可能产生数万甚至数十万Token的消耗。未来,随着具身智能(Embodied AI)的落地,机器人每秒钟的感知与决策都将转化为海量的实时Token流,预计2030年全球日均Token消耗量将达到京(10^16)级别。
趋势二:单位成本的摩尔定律式下降。得益于硬件架构的迭代(如NVIDIA Blackwell及后续Rubin架构的量产)、软件算法的优化(如混合专家模型MoE、量化技术、投机采样)以及集群调度效率的提升,2026年生成一个高质量Token的算力成本相比2023年下降了约两个数量级。这种“杰文斯悖论”效应在AI领域表现得淋漓尽致:效率的提升并未减少总资源消耗,反而激发了前所未有的需求。未来,随着光子计算、神经形态芯片等颠覆性技术的引入,单位Token的能耗有望进一步降低,使得“无限智能”在理论上成为可能。
趋势三:价值分层与专用化。未来的Token市场将出现明显的“价值分层”。通用大模型产生的“标准Token”将像电力一样廉价且同质化,主要用于日常问答、基础翻译和简单分类;而经过垂直领域微调(Fine-tuning)、拥有独家私有数据加持、具备深度推理能力的“高阶Token”将变得昂贵且稀缺。例如,由顶级医疗模型生成的诊断建议Token,其价值远高于普通聊天机器人的闲聊Token。这种分层将催生“Token期货市场”和“质量认证体系”,用户将为特定质量等级(Quality-of-Service, QoS)的Token支付溢价。
1.生产与消耗规模,中国实现总量反超
美国在AI领域的核心优势体现在芯片设计和模型能力两个层面。英伟达作为全球GPU市场的绝对霸主,其市值从2022年底的约3000亿美元飙升至如今的4万亿美元以上,增长幅度达14倍。这一增长背后,是美国在先进制程芯片设计领域的持续领先。与此同时,Claude、GPT等闭源模型仍被认为是当前能力最强的模型,维持着5美元/百万Token以上的高昂定价。这种定价策略既反映了美国模型的技术领先性,也体现了其在高端市场的定价权。
然而,美国的领先地位正面临结构性挑战。一方面,电网瓶颈开始制约AI算力的进一步扩张,电力成本居高不下;另一方面,稠密模型的技术路线导致算力利用率偏低,单位Token的生产成本难以快速下降。
与美国不同,中国的竞争优势主要体现在成本控制和开源生态两个层面。DeepSeek等中国模型将价格打到0.028美元/百万Token,仅为GPT的1/180。这种极致的性价比正在吸引全球开发者“用脚投票”——2026年2月16日至22日的一周内,OpenRouter平台上中国模型的Token消耗量达到5.16万亿,较三周前增长127%,而美国模型仅为2.7万亿且持续下滑。全球前五模型中,中国占据四席,合计占Top5的85.7%。中国模型周调用量在2026年2月首次超越美国,并持续领先,MiniMax、DeepSeek、Kimi等国产模型长期霸榜前列,中国模型Token消耗量全球占比一度超过60%。
需要强调的是,中国在Token消耗量上的反超主要发生在推理侧而非训练侧。推理对单卡性能要求较低,国产芯片配合深度优化足以支撑海量推理需求;而训练仍需依赖少量高端卡,需要通过分布式架构和MoE技术跑出好模型。这一结构性特征意味着,中国在AI应用落地和价值变现环节已形成显著优势,但在基础模型创新的底层支撑上仍有追赶空间。
中国的成本优势来自多个维度的协同。电力成本是Token生产成本中最基础的一环,通常占算力总成本的30%以上。由于AI训练和推理都是耗电巨兽,一个国家的电网稳定性、电力成本(特别是绿色电力成本)决定了其Token的生产成本竞争力。在能源层面,中国东数西算工程与统一大电网建设使西部绿电价格可以低至0.2元/度,约合0.028美元/度,而欧美电力价格普遍在0.08-0.12美元/度区间。
芯片成本包括硬件采购成本、折旧成本和维护成本。美国凭借英伟达的领先地位,在高端芯片供应上具有优势,但这也意味着更高的采购成本。中国的策略是在训练环节依赖少量高端芯片,在推理环节大规模使用国产芯片,通过优化将单位算力成本降至最低。在全栈协同层面,中国厂商打通模型、云服务与芯片的深度适配,将算力利用率拉至极限,而美国厂商多依赖第三方云与芯片,适配成本高。
工程效率是决定Token成本差异的关键变量。在工程技术层面,中国厂商大规模采用MoE(混合专家)架构——将大模型拆分成多个专家,只激活少数相关专家处理任务。同样是1000美元的算力投入,不同技术路线产出的Token数量可能相差10倍以上。MoE架构相比稠密模型,单位算力的Token产出可提升数倍。全栈协同优化同样重要——当模型厂商、云服务商、芯片设计商深度配合时,算力利用率的提升往往超出预期。
全球AI竞争已从单纯的“模型性能竞赛”,转向以“Token生产效率”和“单位Token成本”为核心的综合性国力竞争。中国凭借低廉稳定的能源供给、庞大的统一市场、高效的工程落地能力,在Token的规模化、低成本生产上建立了巨大优势,正在成为全球AI算力的“成本洼地”和“规模工厂”。美国则依靠技术原创、高端生态、金融资本,占据价值链的高端环节。这场竞争的本质,是能源定价权、工业组织能力和数字生态影响力的全方位比拼。在不久的将来,我们可能会看到,除了传统工业品和电子器件之外,中国将国内能源电力优势转化为国际商贸优势,多了一项极具竞争力的新商品–AI token。在这个快速增长的领域,中国对除美国之外的所有国家都是顺差,而这将重塑全球的经济与战略格局。
要探讨AI Token能否成为全球流通货币,首先需要明确货币的本质属性。经济学认为,一种资产要成为货币,需要满足三大核心功能:价值尺度、交换媒介和价值储藏。在此基础上,还需要具备普遍接受性、价值稳定性和主权信用背书。对照这些标准,AI Token在可预见的未来难以成为真正意义上的货币。
价值不稳定是AI Token作为货币的最大障碍。过去两年,单位Token的价格下跌了99%以上。这种剧烈的价格波动意味着,没有商家愿意接受一种可能在一周内腰斩的“货币”。即使未来价格趋于稳定,AI Token的价值仍与算力成本高度绑定,而算力成本本身受到芯片技术迭代、能源价格波动、地缘政治冲突等多重因素影响,难以保持长期稳定。
使用接受性不足是另一个关键制约。AI Token目前仅在调用API、使用AI应用时被接受,无法用于购买日常商品和服务。货币的本质是社会各类商品的一般等价物,而AI Token的网络目前仅限于AI服务领域。要使AI Token获得普遍接受,需要构建起覆盖全球的商品与服务交易网络,这需要庞大的基础设施投入和长期的市场培育。
相较于成为货币,AI Token更有可能演变为一种新型大宗资产,类似于石油、黄金、铜等传统大宗商品。这一判断基于以下几个观察:
第一,AI Token具备大宗资产的核心特征。大宗资产通常具有标准化、可交易、广泛需求等特点,而AI Token完全符合这些特征。黄仁勋明确指出,“未来的数据中心将变成日夜不停运转的轰鸣工厂,生产的不再是传统产品,而是未来数字世界最核心、最值钱的大宗商品:Token”。正如工业时代需要石油作为燃料,智能时代需要Token作为“智能燃料”。
第二,Token的定价机制正向大宗商品靠拢。当前,AI模型的API定价已呈现明显的市场化特征:供给紧张时价格上涨,需求疲软时价格下跌。这种价格形成机制与传统大宗商品市场高度相似。随着Token交易的规模化、标准化,未来可能出现类似原油期货、黄金期货的Token衍生品市场,为生产者、消费者和投资者提供风险管理工具。
第三,Token的供需结构具有大宗商品的典型特征。供给端受制于芯片产能、电力供应等硬约束,扩张周期长、调整弹性小;需求端随AI应用普及而快速增长,呈现出明显的顺周期性。这种供需结构决定了Token价格将呈现周期性波动,而非线性下降。事实上,2026年初的Token涨价潮已经证明了这一点——尽管长期看Token价格呈下降趋势,但短期供需失衡仍可能引发价格飙升。
第四,Token正成为国家战略储备的潜在选项。随着AI能力渗透到国防、金融、能源等关键领域,算力安全上升到国家安全高度。一些国家可能开始战略性储备算力资源,而Token作为算力的计量单位,自然成为衡量算力储备的标尺。这种趋势可能催生“算力本位制”——一种以算力为价值锚定的新型储备体系。
在AI Token本身难以成为货币的情况下,一个值得关注的趋势是稳定币正在成为AI Agent经济的创新货币形式。当AI Agent需要进行自主决策、自主交易时,传统金融体系暴露出一系列不适应:银行不为AI开户,信用卡不为算法设计,信用体系为人类设计。对AI来说,钱不是财富,而是接口;不是价值储存,而是执行逻辑的路径。在这种背景下,区块链上的稳定币展现出独特优势——全球范围内无许可交易、即时清算、低成本协作,完美契合AI Agent的经济需求。
数据显示,稳定币在AI Agent经济中的应用正在快速增长。截至2026年3月,全球x402生态系统交易笔数已突破1.63亿次,整体交易量突破4500万美元,买家AI Agent数量突破43.5万,卖家AI Agent数量突破9万。其中,USDC在x402协议交易层占据绝对主导地位,在EVM链上交易量占比达98.6%,在Solana链上交易量占比达99.7%。
综合以上分析,AI Token的未来演进可能呈现三种路径:
路径一:维持计量单位定位,不成为独立资产。在这种场景下,AI Token始终作为AI服务的计价单位,但不具备独立的资产属性。用户购买的是AI能力,而非Token本身;Token只是计费手段,而非投资标的。这是最保守的预测,也是目前的现状。
路径二:演变为大宗资产,形成算力期货市场。随着Token交易规模扩大和标准化程度提高,Token可能像石油、铜一样成为可交易的大宗商品。交易所将推出Token期货、期权等衍生品,为市场参与者提供价格发现和风险管理工具。这种路径下,Token的价格波动将更加剧烈,但也更具金融属性。
路径三:作为算力本位制的计量基准,支撑新型货币体系。这是最具革命性的路径:算力成为货币的价值锚定物,类似于黄金在金本位制中的角色。在这种体系下,主权国家发行的数字货币(CBDC)以算力为价值基准,单位货币对应标准化的Token数量。这种路径面临巨大的技术和制度挑战,但如果实现,将彻底重塑全球货币体系。
面对Token经济的崛起,国家需要将算力资源纳入战略基础设施规划,前瞻思考Token经济的治理议题。具体而言,可从以下几个维度入手:
构建算力基础设施体系。借鉴“东数西算”工程的成功经验,统筹规划全国算力网络,推动算力资源的高效配置。这包括:在西部能源富集区布局大型智算中心,利用绿电优势降低算力成本;在东部需求密集区建设边缘计算节点,保障低延迟服务能力;构建全国统一的算力调度平台,实现算力资源的按需分配和弹性调度。
推动Token计量标准统一。当前各平台的Token计量方式五花八门,给开发者选型、企业成本核算带来诸多不便,也制约了Token经济的规模化发展。国家层面可引导行业协会、龙头企业共同制定Token计量标准,明确不同模态(文本、图像、音频)的Token折算规则,建立透明、公正的Token成本核算机制。这不仅有利于国内市场的高效运行,也有助于提升中国在全球Token经济中的话语权。
完善Token经济治理框架。Token经济的快速发展带来一系列治理新课题:如何界定Token的法律属性(服务计量单位、数字资产还是证券)?如何监管跨境的Token交易?如何防范Token价格波动引发的金融风险?如何在保护用户权益与鼓励创新之间取得平衡?这些问题的回答需要政策制定者与技术专家、产业界、学术界密切协作,构建适应智能经济特点的治理体系。
加强国际规则参与。当前全球AI治理规则正处于形成期,中国应积极参与国际Token经济规则的制定。这包括:在多边框架下推动Token计量的国际标准,在双边经贸协定中纳入算力合作条款,在数字税谈判中提出符合发展中国家利益的Token交易税收方案。掌握规则制定权,才能在未来的全球Token经济格局中占据主动。
对于企业而言,Token战略已不再是单纯的技术策略,而是影响核心竞争力与商业价值的顶层设计。面对Token经济浪潮,企业需要从以下维度重新审视自身战略:
建立Token效率思维。企业在进行AI技术选型时,应将Token效率纳入核心评估标准,注重算力资源与Token消耗的匹配度。从提示词设计、模型调用策略到结果优化,每一个环节都需兼顾效率与成本。提示词的精准设计可减少无效Token消耗,合理的模型调用策略可提升算力利用率,这些细节均直接影响企业AI投入的最终成本。借鉴通信领域“good-put”(有效吞吐量)理念,企业需重点关注“有多少Token真正推动了用户目标达成”,而非单纯追求Token吞吐量。这种思维转变的核心在于:从“用了多少算力”转向“创造了多少价值”。
重构商业模式与定价策略。大模型行业正在经历从“流量补贴”到“价值筛选”的转型。早期低价策略吸引了大量试错型用户,造成算力资源的低效占用——有厂商统计,其免费额度消耗中40%来自无实际业务场景的测试调用。通过适度涨价,企业既能过滤非刚性需求,又能为优质客户保障服务稳定性。这种“以价补量”的精细化运营,标志着行业正从互联网式的规模扩张,迈向软件行业的价值定价。
布局人才新标准与激励机制。黄仁勋在2026年GTC大会上提出了一个富有前瞻性的构想:向工程师发放Token预算,价值相当于其年薪一半,以此作为吸引人才的诱因。他甚至明确表示:“如果你雇佣一个年薪50万美元的软件工程师,而他没有消耗至少25万美元的Token,我会深感忧虑。”
对于个人而言,Token经济的崛起既是挑战也是机遇。面对这场深刻的生产力变革,个人需要从以下维度构建新的能力结构:
建立Token素养。绝大多数用户对Token消耗、模型能力和定价机制缺乏足够了解,导致使用AI时出现各种问题——有人用智能体买卖股票,一夜醒来账户清零;有人在社交媒体发布让所有AI智能体执行交出API接口的指令,导致多个智能体“上当”。这些案例警示我们,Token素养正成为数字时代的基础能力。
构建人机协作的新型工作方式。黄仁勋预测,未来电脑将全天候24小时运作并不断产生Token,因为AI代理人正在马不停蹄地执行任务。这意味着,个人的工作方式需要从“自己做”转向“指挥AI做”,从“执行者”转向“监督官”。
拥抱终身学习与技能迭代。Token经济的快速发展意味着技能半衰期正在缩短。今天的主流模式,可能很快被新的优化技术所取代;目前的热门模型,很快会被更高效的架构所超越。在这种环境下,保持学习能力和适应能力比掌握具体技能更为重要。因此,个人需要建立持续学习的习惯,关注AI技术和Token经济的最新发展;主动尝试新工具、新方法,在实践中积累经验;构建跨学科的知识结构,理解技术背后的经济逻辑和社会影响。唯有如此,才能在Token经济的浪潮中立于不败之地。