✍️ Gate 广场「创作者认证激励计划」进行中!
我们欢迎优质创作者积极创作,申请认证
赢取豪华代币奖池、Gate 精美周边、流量曝光等超 $10,000+ 丰厚奖励!
立即报名 👉 https://www.gate.com/questionnaire/7159
📕 认证申请步骤:
1️⃣ App 首页底部进入【广场】 → 点击右上角头像进入个人主页
2️⃣ 点击头像右下角【申请认证】进入认证页面,等待审核
让优质内容被更多人看到,一起共建创作者社区!
活动详情:https://www.gate.com/announcements/article/47889
Token成为“吞金兽” 大厂算力涨疯了
有没有发现,这半年AI圈的画风变得有点快?
去年这个时候,大家还在为算力降价狂欢。阿里云带头喊出“最高降幅60%”,腾讯云、华为云、百度云齐刷刷跟上,那阵仗,简直像双十一大促。创业群里天天有人晒账单:“看,我这一百万Token才花了几毛钱!”那会儿人人都觉得,AI创业的春天来了,算力跟白菜一样便宜,谁还做不起大模型应用啊?
结果呢?打脸来得太快。
就上个月,风向一百八十度大转弯。谷歌、亚马逊、腾讯、阿里、百度,10天之内全发了涨价公告。涨多少?普遍30%到50%。最狠的是腾讯云,有个核心产品直接涨了400%。
从“跳楼大甩卖”到“坐火箭式涨价”,前后不到一年。到底发生了什么?谁在背后推着价格往上走?更重要的是,这波涨价潮里,谁最惨,谁在偷笑?
去年还在“打骨折”,今年为什么集体涨价?
先简单回顾一下这出“反转大戏”。
2025年4月,阿里云率先扔出一颗重磅炸弹:核心产品最高降价60%。这可不是小打小闹,是实打实的“腰斩再打折”。紧接着,京东云说“随便降,我跟”,腾讯云、华为云、百度云全部跟进。一时间,算力市场硝烟弥漫,价格战打得那叫一个热闹。
那会儿的口号是什么?“让AI用得起”“算力普惠”。很多创业公司真的信了,开始大张旗鼓地烧Token、跑模型。
然而,免费的午餐从来吃不长久。
2026年1月,亚马逊AWS悄悄干了件事——没有任何发布会,没有任何预告,直接把EC2服务器价格上调了15%左右。别看幅度不大,意义可大了:这是云服务行业近二十年来第一次涨价。要知道,过去二十年,AWS降价的次数超过一百次,从来只有往下走,没有往上调的道理。
这一下,像是推倒了多米诺骨牌。
3月11日,腾讯云跟进,旗下Tencent HY2.0 Instruct模型输入价格从0.0008元/千tokens涨到0.004505元/千tokens——涨幅463%,四倍多。3月18日,阿里云宣布算力卡产品上涨5%到34%,百度智能云也跟着涨了5%到30%。那些之前免费公测的大模型,比如GLM 5、MiniMax 2.5、Kimi 2.5,全部结束“白嫖期”,转入正式计费。
从“抢着降价”到“抢着涨价”,为什么变化这么快?
表面看是云厂商扛不住了。GPU芯片越买越贵,数据中心的电费占运营成本的40%到60%,再加上2025年下半年存储芯片也开始涨价,成本端的压力实实在在地压过来了。但真正让涨价变成“不得不做”的,是另一个更根本的原因——算力,真的不够用了。
谁在疯狂“吃”Token?140万亿的真相
之前不是说算力过剩吗?怎么突然就不够用了?
答案是:Token被“吃”得太快了。
根据国家数据局局长刘烈宏在今年3月披露的数据:到2026年3月,中国每天的Token调用量已经突破了140万亿。
这个数字有多夸张?给你两个参照:
· 2024年初,这个数字只有1000亿。两年时间,涨了一千多倍。
· 2025年底,这个数字是100万亿。也就是说,仅仅过去三个月,又涨了40%——光这三个月新增的量(40万亿),就是2024年初全天的400倍。
这不是线性增长,这是海啸。
那么问题来了:谁在疯狂消耗Token?
答案就一个词:智能体(Agent)。
去年开始,以开源智能体OpenClaw(江湖人称“龙虾”)为代表的产品火得一塌糊涂。AI从一个只会“聊天”的机器人,变成了一个能“干活”的助手——帮你订机票、写代码、做PPT、分析数据……听起来很酷对吧?但代价是,智能体干一件简单的事,消耗的Token量是普通对话的10倍到100倍。
举个例子:让AI帮你写一个爬虫脚本。如果是普通对话,它给你一段代码,你复制走人,消耗几百个Token。但如果是智能体,它要自己跑代码、报错、调试、再跑、再调……来来回回十几轮,Token消耗直接奔着几万去了。
更别提视频生成这种“吞金兽”。有分析指出,生成1分钟的视频大约要消耗10万亿Token。而现在的视频模型,生成5秒的视频才收你几毛钱到几块钱——这哪是赚钱,这分明是赔本赚吆喝。但架不住用的人多啊,视频、音乐、代码、数据分析……每个方向都在疯狂“吃”Token。
供给跟不上需求,算力自然就涨价了。这不是阴谋,是赤裸裸的供需失衡。
算力排位赛:大厂吃肉,小玩家连汤都喝不上
涨价这件事,对不同的人,意味完全不同。
对云厂商来说,涨价其实是好事。有券商算过一笔账:阿里云每提价1%,它的利润率就能提升1个百分点。所以你看到的数据是,阿里云的份额不降反升,已经占到了中国AI云市场的36%。而在AI调用量这个更细的赛道里,火山引擎(字节旗下)更是占了将近50%——也就是说,全中国一半的Token调用,走的是火山引擎的管道。
与此同时,华为云、腾讯云的份额在微幅下滑。头部效应越来越明显:大厂越做越强,资源越聚越集中。
那谁最惨?
中小AI创业公司,以及那些刚入局的小玩家。
原因很简单:涨价直接推高了他们的运营成本。以前Token便宜的时候,你可以随便跑实验、随便调模型,反正花不了几个钱。现在价格翻了几倍甚至十几倍,每一轮训练、每一次推理都要掂量掂量。
更麻烦的是,小玩家没有议价能力。大客户可以跟云厂商签长期协议,锁定一个相对优惠的价格。你一个初创公司,一年才花几万块钱的算力费,谁跟你谈折扣?只能老老实实按涨价后的价格付钱。
很多原本打算做AI应用的项目,算了一笔账之后,默默搁置了。还有一些已经在做的,要么缩减规模,要么自己扛着亏损硬撑。偏偏终端市场竞争又激烈,你不敢轻易给用户涨价——隔壁家还免费呢,你一收费用户全跑了。最后所有的成本压力,只能自己咽下去。
一位从业者跟我吐槽:“以前觉得算力便宜,创业门槛低了。现在才发现,门槛不是低了,是先让你进来,再把门关上。”
这其实是一场残酷的排位赛。过去二十年,云厂商靠“低价走量、先圈地再盈利”的打法活得很滋润。但那个时代结束了。算力正式告别补贴期,进入商业化定价阶段。未来比拼的不再是谁更便宜,而是谁的服务更稳定、谁的生态更完善、谁能帮企业真正用好每一分算力。
而在这场排位赛里,小玩家大概率要被甩下车。
回头看看这一年多的过山车,你会发现一个挺扎心的真相:
算力从“白菜价”到“火箭价”,本质上是AI行业从野蛮生长走向成熟的一个缩影。免费时代结束了,价值竞争开始了。那些靠补贴活着的商业模式会死掉,而那些真正有技术、有场景、有用户的产品,会在算力成本上升的环境中活下来,甚至活得更好。
AI创业的核心竞争力,从来不是算力有多便宜,而是你拿算力来干什么。
算力时代,Token确实贵。但比Token更贵的,是一个知道怎么用好Token的脑子。