涨十周后连降两周!全球AI大模型Token调用量遭遇逆转,到底谁在为算力涨价买单?
“免费午餐”结束,算力账单来了。
狂飙十周的AI大模型Token调用量,在2026年4月突然踩下“急刹车”。
作为AI行业的核心 “晴雨表”,全球最大AI模型API聚合平台OpenRouter数据显示:全球大模型总调用量在连续10周增长后,4月6日- 12日、4月13日- 19日连续两周下滑,最新单周总量降至20.6万亿Token。更值得关注的是,中美市场走势彻底分化 ——中国大模型周调用量环比暴跌23.77%至4.44万亿Token,美国模型逆势增长20.62%至4.91万亿 Token,近两月首次反超。

01 国产模型产品力迎大考
“Token资费普遍上涨,成本增高,用户不得不控制总量节约成本。”上海财经大学特聘教授胡延平告诉《每日经济新闻》记者,当价格优势不再突出,模型的产品力便成为左右用户选择的关键。
胡延平分析,上周美国AI大模型调用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉动。这两款模型已成为编程领域的“硬通货”,而国产大模型在这方面的产品力仍需提升。
OpenRouter数据显示,上周,Claude Sonnet4.6冲上榜首,周调用量达1.38万亿Tokens,环比增长19%。Claude Opus4.6位居第三,周调用量达1.22万亿Tokens。两款模型合计占美国AI大模型周调用量逾五成。
与此形成对比的,是近期国产模型的过山车行情。
在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66万亿Tokens的周调用量居全球榜首,但仅过一周(4月13日至19日)便下滑出榜单。
此外,记者注意到,此前多次上榜的Kimi K2.5、智谱GLM系列模型,已连续三周未登榜。此前一度冲上榜单第二的阶跃星辰Step 3.5 Flash,近两周同样无缘榜单。
胡延平认为,OpenRouter平台的用户以开发者和中小企业为主,对模型迭代能力和垂直场景产品力要求极高。“市场用户有往头部主力模型集中的趋向,在能够触达的范围内,用户只用最好的。”他指出,用户场景越来越要求模型具备强工具调用能力、多Agent(智能体)支持、长程复杂任务的持续达成能力,目前OpenRouter上的大部分模型在这方面还需着力提升。
有业内人士也向《每日经济新闻》记者指出,算力成本上涨后,行业内普遍优先选择性能稳定、输出效果可靠的工具,价格已非首要考量。
02 算力涨价的根源:需求 “海啸” 撞上供给 “天花板”
这场 AI 算力涨价,不是短期波动,而是供需彻底失衡的必然结果,核心是需求指数级爆发,供给却被物理瓶颈死死卡住。
1)需求端:AI 智能体引爆,Token 消耗 “千倍增长”
2026 年 AI 行业最大的变量,是 **AI Agent(智能体)** 的规模化爆发。以爆款应用 OpenClaw(“龙虾”)为代表,智能体彻底改变了 Token 消耗逻辑:
– 传统模式:人机一问一答,Token 消耗线性增长,单次对话仅数十至数百 Token;
– Agent模式:自主拆解任务、多轮迭代、自我纠错、反复调用工具,单任务 Token 消耗暴涨 1000 倍。
数据更直观:今年 3 月,我国日均 Token 调用量超 140 万亿,较 2024 年初增长超 1000 倍。一个普通智能体运行一天,算力成本就高达 1000-5000 美元;甚至有企业吐槽,“200 美元订阅费的用户,每月消耗 5000 美元算力”,完全 “卖得越多亏得越多”。
2)供给端:硬件、产能、能源三重 “硬约束”
需求狂飙,但算力供给却被物理世界牢牢锁死:
– GPU 芯片极度稀缺:英伟达 Blackwell 芯片时租 4.08 美元,两月涨 48%;H100 年租价从 1.7 美元 / 小时涨至 2.35 美元,涨幅近 40%;B200 租价达 5.47 美元 / 小时,环比涨 23.5%。高端 GPU 订单排至 2027 年,有钱也租不到。
– HBM 内存价格翻倍:作为大模型核心存储,HBM 产能不足,2026 年一季度价格直接暴涨 90%。
– 先进封装与能源瓶颈:英伟达 CoWoS 封装需求年增 40%,产能严重不足;同时,AI 算力耗电极增,多地出现电力供应紧张,进一步限制算力扩张。
无限需求撞上刚性供给,算力从 “普惠资源” 变成 “顶级稀缺资产”,涨价成了唯一出路。
03 用户“用脚投票”:国产模型遭遇“过山车”
面对上涨的Token价格,最敏感的开发者和中小企业开始“用脚投票”。
以前,大家看谁家搞促销、送Token就用谁家;现在,Token成了真金白银的生产资料,价格不再是唯一标准,性价比和硬实力才是关键。
1)OpenRouter的数据揭示了残酷的现实:
在4月的第二周,阿里的Qwen3.6 Plus还曾以1.66万亿Tokens的调用量登顶全球榜首;仅仅一周之后,它就跌出了榜单。与此同时,Kimi K2.5、智谱GLM系列等曾经的明星模型,已连续三周消失在主流视野。
2)取而代之的是谁?是能“干活”的模型。
数据显示,美国模型的反弹完全由Anthropic旗下的Claude Sonnet和Opus拉动。这两款模型已成为海外编程领域的“硬通货”,无论是代码生成还是复杂逻辑推理,用户认为哪怕贵一点,只要产出稳定,就是划算的。
04 谁在为算力涨价买单?四层成本传导,全行业承压
算力涨价的成本,不会凭空消失,而是沿着产业链层层传导,从厂商到企业、从开发者到个人用户,最终由全行业共同承担,只是承担方式与压力各不相同。
1)第一层:云厂商与模型企业 ——“被迫涨价,修复利润”
过去两年,AI 行业陷入 “低价内卷”:云厂商靠补贴抢客户、大模型企业烧钱换流量,长期 “亏损获客”。
涨价对它们而言,是 **“被动自救”**:
– 缓解 GPU、HBM 的巨额折旧与采购压力,从 “规模优先” 转向 “价值优先”;
– 把稀缺算力向高毛利、高价值的企业客户集中,淘汰低价值的个人粗放调用;
– 头部厂商(如拥有自研芯片的企业)反而受益,成本优势进一步拉大,加速行业出清。
2)第二层:中小企业与开发者 ——“成本暴增,生死考验”
这是最直接的承压层。绝大多数中小 AI 企业、独立开发者没有自建算力能力,完全依赖云端 API 与算力租赁:
– 创业公司:AI 应用成本直接上涨 30%-200%,利润被大幅挤压,“PPT 创业” 彻底失去土壤;
– 中小开发者:低价调用时代终结,大量个人项目、低价值应用因成本过高直接停服;
– 行业分化:能靠 AI 创造高营收(如电商 AI、企业 SaaS)的企业尚能承受,纯工具、低变现项目直接被淘汰。
3)第三层:重度用户与企业客户 ——“转嫁成本,优化使用”
对大型企业、AI 重度用户而言,涨价是 **“成本转嫁 + 效率优化”**:
– 一方面,将上涨的 AI 成本部分转嫁给终端客户(如 AI 增值服务提价);
– 另一方面,主动优化 Token 使用:减少无效调用、精简上下文、切换更高能效的模型,倒逼 “精细化运营”。
4)第四层:普通个人用户 ——“感知有限,体验分化”
个人用户感受相对间接:
免费额度缩水、免费模型质量下降、付费订阅价格上涨;
大量低质低价的国产模型服务下架,反而倒逼用户转向更优质、更稳定的头部模型,“劣币驱逐良币” 的现象被逆转。
一句话总结:算力涨价的单,最终由 “全行业共担”—— 低效产能被出清,高效玩家留到最后,行业从 “野蛮生长” 走向 “高质量发展”。
05 专家:全球消耗量仍处快速增长通道
短期数据波动,是否意味着AI应用热潮正在消退?
“短期还不宜下结论。”胡延平提醒,OpenRouter的Token调用量仅占全球消耗总量的约2%~4%,其排名波动更多反映的是开源、二线及新发模型的竞争态势,不能代表整个市场的走向。
事实上,成本压力正在倒逼市场进化。胡延平观察到,今年初以来,OpenClaw等各类智能体、多Agent应用已将Token调用量拉升至去年底的两三倍水平;成本大幅抬高,促使企业和用户转而采用记忆优化、提示词压缩、Harness Engineering(约束工程)等手段主动降耗。
记者了解到,甚至有中小创业者已将Token使用量纳入员工绩效考核。市场正从单纯追求数量的“堆量”阶段,进化到追求更高投入产出比的“提效”阶段。
更深层的变化,在于AI应用场景本身的质变。国联民生证券一份研报中提出“Token通胀”的概念。这并非指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。
用户的需求正从浅层的“问答”转向深度的“干活”。Token不是传统互联网时代边际成本几乎为零的“流量”,而是执行生产任务时必不可少的“燃料”。
摩根大通在研报中对中国市场作出极为乐观的预测,预计2025年至2030年,中国Token消耗量的年复合增长率将达330%,5年内将实现370倍增长。
胡延平同样对长期趋势保持坚定乐观:“就中长期而言,无论OpenRouter上的统计数据如何波动,包括中国在内,全球Token消耗总量都处在快速增长通道,未来两三年会有数十倍甚至数百倍的增加。”
涨十周、降两周,看似是数据波动,实则是 AI 行业的一次深刻 “压力测试”。
算力涨价,挤掉了行业的虚假繁荣,淘汰了低效产能与投机者,留下真正有技术、有场景、有商业化能力的玩家。Token 调用量的收缩,不是 AI 的终点,而是理性发展的起点—— 当每一分算力都用在 “创造价值” 上,AI 才能真正从 “概念热潮” 走向 “产业刚需”。
至于 “谁为算力涨价买单”?答案是:所有人,但也只有扛过成本压力、守住价值底线的人,才能笑到最后。
这场 AI 算力的 “大通胀”,才刚刚开始。