涨十周后连降两周!全球AI大模型Token调用量遭遇逆转,到底谁在为算力涨价买单?

“免费午餐”结束,算力账单来了。

狂飙十周的AI大模型Token调用量,在2026年4月突然踩下“急刹车”。

作为AI行业的核心 “晴雨表”,全球最大AI模型API聚合平台OpenRouter数据显示:全球大模型总调用量在连续10周增长后,4月6日- 12日、4月13日- 19日连续两周下滑,最新单周总量降至20.6万亿Token。更值得关注的是,中美市场走势彻底分化 ——中国大模型周调用量环比暴跌23.77%至4.44万亿Token,美国模型逆势增长20.62%至4.91万亿 Token,近两月首次反超。

AI大模型Token调用

01 国产模型产品力迎大考

“Token资费普遍上涨,成本增高,用户不得不控制总量节约成本。”上海财经大学特聘教授胡延平告诉《每日经济新闻》记者,当价格优势不再突出,模型的产品力便成为左右用户选择的关键。

胡延平分析,上周美国AI大模型调用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉动。这两款模型已成为编程领域的“硬通货”,而国产大模型在这方面的产品力仍需提升。

OpenRouter数据显示,上周,Claude Sonnet4.6冲上榜首,周调用量达1.38万亿Tokens,环比增长19%。Claude Opus4.6位居第三,周调用量达1.22万亿Tokens。两款模型合计占美国AI大模型周调用量逾五成。

与此形成对比的,是近期国产模型的过山车行情。

在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66万亿Tokens的周调用量居全球榜首,但仅过一周(4月13日至19日)便下滑出榜单。

此外,记者注意到,此前多次上榜的Kimi K2.5、智谱GLM系列模型,已连续三周未登榜。此前一度冲上榜单第二的阶跃星辰Step 3.5 Flash,近两周同样无缘榜单。

胡延平认为,OpenRouter平台的用户以开发者和中小企业为主,对模型迭代能力和垂直场景产品力要求极高。“市场用户有往头部主力模型集中的趋向,在能够触达的范围内,用户只用最好的。”他指出,用户场景越来越要求模型具备强工具调用能力、多Agent(智能体)支持、长程复杂任务的持续达成能力,目前OpenRouter上的大部分模型在这方面还需着力提升。

有业内人士也向《每日经济新闻》记者指出,算力成本上涨后,行业内普遍优先选择性能稳定、输出效果可靠的工具,价格已非首要考量。

02 算力涨价的根源:需求 “海啸” 撞上供给 “天花板”

这场 AI 算力涨价,不是短期波动,而是供需彻底失衡的必然结果,核心是需求指数级爆发,供给却被物理瓶颈死死卡住。

1)需求端:AI 智能体引爆,Token 消耗 “千倍增长”

2026 年 AI 行业最大的变量,是 **AI Agent(智能体)** 的规模化爆发。以爆款应用 OpenClaw(“龙虾”)为代表,智能体彻底改变了 Token 消耗逻辑:

– 传统模式:人机一问一答,Token 消耗线性增长,单次对话仅数十至数百 Token;

– Agent模式:自主拆解任务、多轮迭代、自我纠错、反复调用工具,单任务 Token 消耗暴涨 1000 倍。

数据更直观:今年 3 月,我国日均 Token 调用量超 140 万亿,较 2024 年初增长超 1000 倍。一个普通智能体运行一天,算力成本就高达 1000-5000 美元;甚至有企业吐槽,“200 美元订阅费的用户,每月消耗 5000 美元算力”,完全 “卖得越多亏得越多”。

2)供给端:硬件、产能、能源三重 “硬约束”

需求狂飙,但算力供给却被物理世界牢牢锁死:

– GPU 芯片极度稀缺:英伟达 Blackwell 芯片时租 4.08 美元,两月涨 48%;H100 年租价从 1.7 美元 / 小时涨至 2.35 美元,涨幅近 40%;B200 租价达 5.47 美元 / 小时,环比涨 23.5%。高端 GPU 订单排至 2027 年,有钱也租不到。

– HBM 内存价格翻倍:作为大模型核心存储,HBM 产能不足,2026 年一季度价格直接暴涨 90%。

– 先进封装与能源瓶颈:英伟达 CoWoS 封装需求年增 40%,产能严重不足;同时,AI 算力耗电极增,多地出现电力供应紧张,进一步限制算力扩张。

无限需求撞上刚性供给,算力从 “普惠资源” 变成 “顶级稀缺资产”,涨价成了唯一出路。

03 用户“用脚投票”:国产模型遭遇“过山车”

面对上涨的Token价格,最敏感的开发者和中小企业开始“用脚投票”。

以前,大家看谁家搞促销、送Token就用谁家;现在,Token成了真金白银的生产资料,价格不再是唯一标准,性价比和硬实力才是关键。

1)OpenRouter的数据揭示了残酷的现实:

在4月的第二周,阿里的Qwen3.6 Plus还曾以1.66万亿Tokens的调用量登顶全球榜首;仅仅一周之后,它就跌出了榜单。与此同时,Kimi K2.5、智谱GLM系列等曾经的明星模型,已连续三周消失在主流视野。

2)取而代之的是谁?是能“干活”的模型。

数据显示,美国模型的反弹完全由Anthropic旗下的Claude Sonnet和Opus拉动。这两款模型已成为海外编程领域的“硬通货”,无论是代码生成还是复杂逻辑推理,用户认为哪怕贵一点,只要产出稳定,就是划算的。

04 谁在为算力涨价买单?四层成本传导,全行业承压

算力涨价的成本,不会凭空消失,而是沿着产业链层层传导,从厂商到企业、从开发者到个人用户,最终由全行业共同承担,只是承担方式与压力各不相同。

1)第一层:云厂商与模型企业 ——“被迫涨价,修复利润”

过去两年,AI 行业陷入 “低价内卷”:云厂商靠补贴抢客户、大模型企业烧钱换流量,长期 “亏损获客”。

涨价对它们而言,是 **“被动自救”**:

– 缓解 GPU、HBM 的巨额折旧与采购压力,从 “规模优先” 转向 “价值优先”;

– 把稀缺算力向高毛利、高价值的企业客户集中,淘汰低价值的个人粗放调用;

– 头部厂商(如拥有自研芯片的企业)反而受益,成本优势进一步拉大,加速行业出清。

2)第二层:中小企业与开发者 ——“成本暴增,生死考验”

这是最直接的承压层。绝大多数中小 AI 企业、独立开发者没有自建算力能力,完全依赖云端 API 与算力租赁:

– 创业公司:AI 应用成本直接上涨 30%-200%,利润被大幅挤压,“PPT 创业” 彻底失去土壤;

– 中小开发者:低价调用时代终结,大量个人项目、低价值应用因成本过高直接停服;

– 行业分化:能靠 AI 创造高营收(如电商 AI、企业 SaaS)的企业尚能承受,纯工具、低变现项目直接被淘汰。

3)第三层:重度用户与企业客户 ——“转嫁成本,优化使用”

对大型企业、AI 重度用户而言,涨价是 **“成本转嫁 + 效率优化”**:

– 一方面,将上涨的 AI 成本部分转嫁给终端客户(如 AI 增值服务提价);

– 另一方面,主动优化 Token 使用:减少无效调用、精简上下文、切换更高能效的模型,倒逼 “精细化运营”。

4)第四层:普通个人用户 ——“感知有限,体验分化”

个人用户感受相对间接:

免费额度缩水、免费模型质量下降、付费订阅价格上涨;

大量低质低价的国产模型服务下架,反而倒逼用户转向更优质、更稳定的头部模型,“劣币驱逐良币” 的现象被逆转。

一句话总结:算力涨价的单,最终由 “全行业共担”—— 低效产能被出清,高效玩家留到最后,行业从 “野蛮生长” 走向 “高质量发展”。

05 专家:全球消耗量仍处快速增长通道

短期数据波动,是否意味着AI应用热潮正在消退?

“短期还不宜下结论。”胡延平提醒,OpenRouter的Token调用量仅占全球消耗总量的约2%~4%,其排名波动更多反映的是开源、二线及新发模型的竞争态势,不能代表整个市场的走向。

事实上,成本压力正在倒逼市场进化。胡延平观察到,今年初以来,OpenClaw等各类智能体、多Agent应用已将Token调用量拉升至去年底的两三倍水平;成本大幅抬高,促使企业和用户转而采用记忆优化、提示词压缩、Harness Engineering(约束工程)等手段主动降耗。

记者了解到,甚至有中小创业者已将Token使用量纳入员工绩效考核。市场正从单纯追求数量的“堆量”阶段,进化到追求更高投入产出比的“提效”阶段。

更深层的变化,在于AI应用场景本身的质变。国联民生证券一份研报中提出“Token通胀”的概念。这并非指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。

用户的需求正从浅层的“问答”转向深度的“干活”。Token不是传统互联网时代边际成本几乎为零的“流量”,而是执行生产任务时必不可少的“燃料”。

摩根大通在研报中对中国市场作出极为乐观的预测,预计2025年至2030年,中国Token消耗量的年复合增长率将达330%,5年内将实现370倍增长。

胡延平同样对长期趋势保持坚定乐观:“就中长期而言,无论OpenRouter上的统计数据如何波动,包括中国在内,全球Token消耗总量都处在快速增长通道,未来两三年会有数十倍甚至数百倍的增加。”

涨十周、降两周,看似是数据波动,实则是 AI 行业的一次深刻 “压力测试”。

算力涨价,挤掉了行业的虚假繁荣,淘汰了低效产能与投机者,留下真正有技术、有场景、有商业化能力的玩家。Token 调用量的收缩,不是 AI 的终点,而是理性发展的起点—— 当每一分算力都用在 “创造价值” 上,AI 才能真正从 “概念热潮” 走向 “产业刚需”。

至于 “谁为算力涨价买单”?答案是:所有人,但也只有扛过成本压力、守住价值底线的人,才能笑到最后。

这场 AI 算力的 “大通胀”,才刚刚开始。

相关新闻

  • OpenClaw 能干什么?一个重度用户的 10 个真实用例拆解

    OpenClaw 能干什么?一个重度用户的 10 个真实用例拆解

    OpenClaw非常火爆非常强大,但它也很危险!本文提供最基础的场景介绍,看官按自己的承受能力选择使用 近年来,OpenClaw 龙虾在国内外的技术圈爆火,吸引了众多关注。但与其大量的理论讨论、架构发展方向相比,真正的应用场景却少有人深入剖析。 那么,OpenClaw到底能为我们的日常工作提供哪些切实可行的功能呢?作为一个具备开发能力的用户,我们通过一系列实际案例,展示了OpenClaw的多种应用。通过这些用例,我们能更清晰地看到它如何影响和提升工作效率。 Clawd诞生于2025年11月——这…

    新闻中心 2026-03-02
  • 如何利用GPT等AI大模型解锁ERP的潜力

    如何利用GPT等AI大模型解锁ERP的潜力

    几十年来,企业资源规划 (ERP) 系统一直是企业管理的核心支柱。它通过自动化日常运营流程并提供对关键数据的实时洞察,帮助企业高效管理财务、生产、库存等方面。然而,随着人工智能 (AI) 和自然语言处理 (NLP) 技术的崛起,企业对于更智能、更易用的解决方案需求不断上升,ChatGPT、Cluade等 就是其中的佼佼者。 ChatGPT 是由 OpenAI 开发的一种先进语言模型,能够生成与人类对话相似的文本,并且能高度准确地回答问题。AI大模型强大的功能可以为企业与 ERP系统 的交互带来革…

    新闻中心 2026-04-02
  • AI视觉缺陷检测技术落地方案-塑料注塑件外观质检

    AI视觉缺陷检测技术落地方案-塑料注塑件外观质检

    1. 方案概述 本方案针对塑料注塑件(手机外壳、家电面板、汽车内饰塑件等)的外观质量管控需求,基于AI视觉+多角度成像+边缘计算技术架构,实现飞边、缩水痕、划伤、顶白、色差、异物六大类缺陷的自动化高精度识别。 其中飞边、缩水痕、顶白列为严重缺陷,执行100%全量检出标准,杜绝漏检;划伤、色差、异物实现精准识别与分级告警,替代人工目视检测,提升检测效率、一致性与质量管控水平。 方案采用”顶拍+侧拍+背光”三路成像布局,搭配白光、环形同轴光双光源互补成像,依托边缘计算盒实现本…

  • 智能问数ChatBI - AI时代的BI报表解决之道

    智能问数ChatBI – AI时代的BI报表解决之道

    ——从传统BI报表到AI大模型驱动的数据决策升级 在企业数字化转型不断深入的背景下,数据已经成为管理层最核心的决策依据。然而,很多企业在实际运营过程中依然面临一个普遍问题:数据很多,报表很多,但真正支撑决策的内容却很少。 随着企业逐步迈入数字化转型的深水阶段,数据已成为经营决策的核心资产。与此同时,AI技术的快速发展正在改变企业获取和使用数据的方式。过去以“拖拽式”操作为主的传统 BI报表工具,正在被更加直观的自然语言交互方式所替代。通过 ChatBI 或 AI问数系统,业务人员无需掌握复杂的数…

  • 2026年4月AI大模型排名:谷歌登顶,国产模型全面崛起

    2026年4月AI大模型排名:谷歌登顶,国产模型全面崛起

    如果你最近还在用半年前选定的AI模型做业务,可能要重新看一看了。 Artificial Analysis 每72小时更新一次的 LLM 排行榜,目前已收录 317 个模型。这张榜单不是看论文发表数量,也不靠厂商自报,而是从实际 API 调用中采集智能指数、响应速度、成本和延迟这几个维度的实测数据。换句话说,它大致反映了”花钱买到的模型到底怎么样”。 智能指数前五,格局已经变了 排行榜的核心是”智能指数(Intelligence Index)”,满分…

    新闻中心 2026-04-13
  • AI时代还需要定制开发软件吗

    AI时代还需要定制开发软件吗

    AI大模型正在快速改变软件生产方式,很多企业开始问同一个问题:既然AI已经能自动写代码,为什么还要投入软件定制开发和系统定制开发?表面看,AI让开发更快了;但站在企业决策层的角度,真正要解决的不是“能不能写出代码”,而是“能不能支撑业务长期增长、稳定交付、可控维护”。 如果你的系统只是一次性工具,标准化产品也许够用;但一旦涉及多部门协同、复杂流程、数据治理、权限控制、合规要求和未来扩展,AI大模型只能提高效率,不能替代架构设计、业务抽象和工程管理。换句话说,AI时代不是不需要定制开发,而是更需要…

    新闻中心 2026-04-07
  • AI Agent 到底是怎么干活的?一文弄懂AI Agent完整工作流程

    AI Agent 到底是怎么干活的?一文弄懂AI Agent完整工作流程

    想象一下,你告诉AI:“帮我策划一个下周末去杭州的两天一夜旅行,预算2000元,要包含高铁票和一家评分4.5以上的酒店,然后把行程发到我的邮箱。” 如果是在几年前,你可能会得到一个包含各种链接和文字建议的回复。但今天,一个真正的AI Agent(智能体)会怎么做? 它会像一个经验丰富的私人助理一样,默默地开始工作:查询下周末的高铁班次、比较价格和余票;搜索杭州的酒店,并根据你的预算和评分要求进行筛选;将选定的交通和住宿信息整合成一个清晰的行程表;最后,将这个行程表打包发送到你指定的邮箱。 这一切…

    新闻中心 2026-04-15
  • 当库存也能被"预见":AI补货预测正在替代什么

    当库存也能被”预见”:AI补货预测正在替代什么

    很多公司都有这样一个人。 在仓库工作了二十年,每次到季节切换前,他会提前两三周跟采购说:”备一批厚外套,今年冷得早。”也会在节假日前拍板:”节后第一周别大量进货,消费者还没缓过来。”问他凭什么,他说不清楚,就是感觉。 但他的感觉大多数时候是对的。库存很少积压,也很少断货。 然后有一天,他退休了。 接手的人学历更高,更熟悉系统,但就是做不到那种”刚好”。要么多备了一堆卖不出去,要么在爆单的时候仓库空了,客户投诉接二连三。 这个…

    新闻中心 2026-04-01
  • 企业定制系统打通飞书、钉钉、企业微信:不是锦上添花,是刚需

    企业定制系统打通飞书、钉钉、企业微信:不是锦上添花,是刚需

    上个月一个做连锁餐饮的老板跟我吐槽:花了小三十万搞了套巡店系统,督导们死活不用。催了仨月,后台数据还是稀稀拉拉。他特郁闷,问我是不是被开发商坑了。 我让他把系统打开看了看,功能没毛病,界面也过得去。问题出在哪?督导在外面跑,手机上成天挂着的是企业微信,要用巡店系统得单独打开另一个App,登录、找入口、传照片,来回倒腾。人家嫌烦,拍完照片直接往群里一丢,回头想起来再补录。甚至有些人压根就不补了。 系统没人用,八成不是系统的锅。是它离员工太远了。 你的系统再好,也干不过员工的使用惯性 说句大实话:你…

  • ERP 如何利用 AI 批量处理报销凭证?从人工录入到智能自动化的升级之路

    ERP 如何利用 AI 批量处理报销凭证?从人工录入到智能自动化的升级之路

    在过去的很长一段时间里,公司财务部面临着同样的“永无止境”工作——报销凭证录入。无论企业规模如何,只要涉及差旅费、办公费、接待费和采购费,就会产生大量文件:发票、收据、订单和付款凭证…这类文件不仅需要人工审核,还需要人工输入。 ERP 系统,工作量大,容易出错。 随着 AI 随着科技的不断发展,越来越多的企业开始考虑:“我们的 ERP 能不能运用 AI大模型对报销凭证进行批量处理?人工录入是否真的可以用AI大模型来替代?AI 报销审核是否可以直接完成?”答案是:不仅可以,而且效果远超…

在线沟通
客服微信
客服微信
在线咨询
联系我们

联系我们

400-103-7662

售前咨询邮箱:
sales@king-v.com

工作时间:
法定工作日 9:00-18:00

返回顶部