涨十周后连降两周！全球AI大模型Token调用量遭遇逆转,到底谁在为算力涨价买单？-上海魁鲸科技

涨十周后连降两周！全球AI大模型Token调用量遭遇逆转,到底谁在为算力涨价买单？

“免费午餐”结束，算力账单来了。

狂飙十周的AI大模型Token调用量，在2026年4月突然踩下“急刹车”。

作为AI行业的核心 “晴雨表”，全球最大AI模型API聚合平台OpenRouter数据显示：全球大模型总调用量在连续10周增长后，4月6日- 12日、4月13日- 19日连续两周下滑，最新单周总量降至20.6万亿Token。更值得关注的是，中美市场走势彻底分化 ——中国大模型周调用量环比暴跌23.77%至4.44万亿Token，美国模型逆势增长20.62%至4.91万亿 Token，近两月首次反超。

AI大模型Token调用

01 国产模型产品力迎大考

“Token资费普遍上涨，成本增高，用户不得不控制总量节约成本。”上海财经大学特聘教授胡延平告诉《每日经济新闻》记者，当价格优势不再突出，模型的产品力便成为左右用户选择的关键。

胡延平分析，上周美国AI大模型调用量回升，主要由Anthropic旗下Claude Sonnet和Opus模型拉动。这两款模型已成为编程领域的“硬通货”，而国产大模型在这方面的产品力仍需提升。

OpenRouter数据显示，上周，Claude Sonnet4.6冲上榜首，周调用量达1.38万亿Tokens，环比增长19%。Claude Opus4.6位居第三，周调用量达1.22万亿Tokens。两款模型合计占美国AI大模型周调用量逾五成。

与此形成对比的，是近期国产模型的过山车行情。

在此前一周（4月6日至12日），阿里Qwen3.6 Plus以1.66万亿Tokens的周调用量居全球榜首，但仅过一周（4月13日至19日）便下滑出榜单。

此外，记者注意到，此前多次上榜的Kimi K2.5、智谱GLM系列模型，已连续三周未登榜。此前一度冲上榜单第二的阶跃星辰Step 3.5 Flash，近两周同样无缘榜单。

胡延平认为，OpenRouter平台的用户以开发者和中小企业为主，对模型迭代能力和垂直场景产品力要求极高。“市场用户有往头部主力模型集中的趋向，在能够触达的范围内，用户只用最好的。”他指出，用户场景越来越要求模型具备强工具调用能力、多Agent（智能体）支持、长程复杂任务的持续达成能力，目前OpenRouter上的大部分模型在这方面还需着力提升。

有业内人士也向《每日经济新闻》记者指出，算力成本上涨后，行业内普遍优先选择性能稳定、输出效果可靠的工具，价格已非首要考量。

02 算力涨价的根源：需求 “海啸” 撞上供给 “天花板”

这场 AI 算力涨价，不是短期波动，而是供需彻底失衡的必然结果，核心是需求指数级爆发，供给却被物理瓶颈死死卡住。

1）需求端：AI 智能体引爆，Token 消耗 “千倍增长”

2026 年 AI 行业最大的变量，是 **AI Agent（智能体）** 的规模化爆发。以爆款应用 OpenClaw（“龙虾”）为代表，智能体彻底改变了 Token 消耗逻辑：

– 传统模式：人机一问一答，Token 消耗线性增长，单次对话仅数十至数百 Token；

– Agent模式：自主拆解任务、多轮迭代、自我纠错、反复调用工具，单任务 Token 消耗暴涨 1000 倍。

数据更直观：今年 3 月，我国日均 Token 调用量超 140 万亿，较 2024 年初增长超 1000 倍。一个普通智能体运行一天，算力成本就高达 1000-5000 美元；甚至有企业吐槽，“200 美元订阅费的用户，每月消耗 5000 美元算力”，完全 “卖得越多亏得越多”。

2）供给端：硬件、产能、能源三重 “硬约束”

需求狂飙，但算力供给却被物理世界牢牢锁死：

– GPU 芯片极度稀缺：英伟达 Blackwell 芯片时租 4.08 美元，两月涨 48%；H100 年租价从 1.7 美元 / 小时涨至 2.35 美元，涨幅近 40%；B200 租价达 5.47 美元 / 小时，环比涨 23.5%。高端 GPU 订单排至 2027 年，有钱也租不到。

– HBM 内存价格翻倍：作为大模型核心存储，HBM 产能不足，2026 年一季度价格直接暴涨 90%。

– 先进封装与能源瓶颈：英伟达 CoWoS 封装需求年增 40%，产能严重不足；同时，AI 算力耗电极增，多地出现电力供应紧张，进一步限制算力扩张。

无限需求撞上刚性供给，算力从 “普惠资源” 变成 “顶级稀缺资产”，涨价成了唯一出路。

03 用户“用脚投票”：国产模型遭遇“过山车”

面对上涨的Token价格，最敏感的开发者和中小企业开始“用脚投票”。

以前，大家看谁家搞促销、送Token就用谁家；现在，Token成了真金白银的生产资料，价格不再是唯一标准，性价比和硬实力才是关键。

1）OpenRouter的数据揭示了残酷的现实：

在4月的第二周，阿里的Qwen3.6 Plus还曾以1.66万亿Tokens的调用量登顶全球榜首；仅仅一周之后，它就跌出了榜单。与此同时，Kimi K2.5、智谱GLM系列等曾经的明星模型，已连续三周消失在主流视野。

2）取而代之的是谁？是能“干活”的模型。

数据显示，美国模型的反弹完全由Anthropic旗下的Claude Sonnet和Opus拉动。这两款模型已成为海外编程领域的“硬通货”，无论是代码生成还是复杂逻辑推理，用户认为哪怕贵一点，只要产出稳定，就是划算的。

04 谁在为算力涨价买单？四层成本传导，全行业承压

算力涨价的成本，不会凭空消失，而是沿着产业链层层传导，从厂商到企业、从开发者到个人用户，最终由全行业共同承担，只是承担方式与压力各不相同。

1）第一层：云厂商与模型企业 ——“被迫涨价，修复利润”

过去两年，AI 行业陷入 “低价内卷”：云厂商靠补贴抢客户、大模型企业烧钱换流量，长期 “亏损获客”。

涨价对它们而言，是 **“被动自救”**：

– 缓解 GPU、HBM 的巨额折旧与采购压力，从 “规模优先” 转向 “价值优先”；

– 把稀缺算力向高毛利、高价值的企业客户集中，淘汰低价值的个人粗放调用；

– 头部厂商（如拥有自研芯片的企业）反而受益，成本优势进一步拉大，加速行业出清。

2）第二层：中小企业与开发者 ——“成本暴增，生死考验”

这是最直接的承压层。绝大多数中小 AI 企业、独立开发者没有自建算力能力，完全依赖云端 API 与算力租赁：

– 创业公司：AI 应用成本直接上涨 30%-200%，利润被大幅挤压，“PPT 创业” 彻底失去土壤；

– 中小开发者：低价调用时代终结，大量个人项目、低价值应用因成本过高直接停服；

– 行业分化：能靠 AI 创造高营收（如电商 AI、企业 SaaS）的企业尚能承受，纯工具、低变现项目直接被淘汰。

3）第三层：重度用户与企业客户 ——“转嫁成本，优化使用”

对大型企业、AI 重度用户而言，涨价是 **“成本转嫁 + 效率优化”**：

– 一方面，将上涨的 AI 成本部分转嫁给终端客户（如 AI 增值服务提价）；

– 另一方面，主动优化 Token 使用：减少无效调用、精简上下文、切换更高能效的模型，倒逼 “精细化运营”。

4）第四层：普通个人用户 ——“感知有限，体验分化”

个人用户感受相对间接：

免费额度缩水、免费模型质量下降、付费订阅价格上涨；

大量低质低价的国产模型服务下架，反而倒逼用户转向更优质、更稳定的头部模型，“劣币驱逐良币” 的现象被逆转。

一句话总结：算力涨价的单，最终由 “全行业共担”—— 低效产能被出清，高效玩家留到最后，行业从 “野蛮生长” 走向 “高质量发展”。

05 专家：全球消耗量仍处快速增长通道

短期数据波动，是否意味着AI应用热潮正在消退？

“短期还不宜下结论。”胡延平提醒，OpenRouter的Token调用量仅占全球消耗总量的约2%～4%，其排名波动更多反映的是开源、二线及新发模型的竞争态势，不能代表整个市场的走向。

事实上，成本压力正在倒逼市场进化。胡延平观察到，今年初以来，OpenClaw等各类智能体、多Agent应用已将Token调用量拉升至去年底的两三倍水平；成本大幅抬高，促使企业和用户转而采用记忆优化、提示词压缩、Harness Engineering（约束工程）等手段主动降耗。

记者了解到，甚至有中小创业者已将Token使用量纳入员工绩效考核。市场正从单纯追求数量的“堆量”阶段，进化到追求更高投入产出比的“提效”阶段。

更深层的变化，在于AI应用场景本身的质变。国联民生证券一份研报中提出“Token通胀”的概念。这并非指Token本身变贵，而是指单位时间内、单位用户的Token消耗结构性上升。

用户的需求正从浅层的“问答”转向深度的“干活”。Token不是传统互联网时代边际成本几乎为零的“流量”，而是执行生产任务时必不可少的“燃料”。

摩根大通在研报中对中国市场作出极为乐观的预测，预计2025年至2030年，中国Token消耗量的年复合增长率将达330%，5年内将实现370倍增长。

胡延平同样对长期趋势保持坚定乐观：“就中长期而言，无论OpenRouter上的统计数据如何波动，包括中国在内，全球Token消耗总量都处在快速增长通道，未来两三年会有数十倍甚至数百倍的增加。”

涨十周、降两周，看似是数据波动，实则是 AI 行业的一次深刻 “压力测试”。

算力涨价，挤掉了行业的虚假繁荣，淘汰了低效产能与投机者，留下真正有技术、有场景、有商业化能力的玩家。Token 调用量的收缩，不是 AI 的终点，而是理性发展的起点—— 当每一分算力都用在 “创造价值” 上，AI 才能真正从 “概念热潮” 走向 “产业刚需”。

至于 “谁为算力涨价买单”？答案是：所有人，但也只有扛过成本压力、守住价值底线的人，才能笑到最后。

这场 AI 算力的 “大通胀”，才刚刚开始。

涨十周后连降两周！全球AI大模型Token调用量遭遇逆转,到底谁在为算力涨价买单？

联系我们

400-103-7662

涨十周后连降两周！全球AI大模型Token调用量遭遇逆转,到底谁在为算力涨价买单？

相关新闻

联系我们

400-103-7662