涨十周后连降两周!全球AI大模型Token调用量遭遇逆转,到底谁在为算力涨价买单?

“免费午餐”结束,算力账单来了。

狂飙十周的AI大模型Token调用量,在2026年4月突然踩下“急刹车”。

作为AI行业的核心 “晴雨表”,全球最大AI模型API聚合平台OpenRouter数据显示:全球大模型总调用量在连续10周增长后,4月6日- 12日、4月13日- 19日连续两周下滑,最新单周总量降至20.6万亿Token。更值得关注的是,中美市场走势彻底分化 ——中国大模型周调用量环比暴跌23.77%至4.44万亿Token,美国模型逆势增长20.62%至4.91万亿 Token,近两月首次反超。

AI大模型Token调用

01 国产模型产品力迎大考

“Token资费普遍上涨,成本增高,用户不得不控制总量节约成本。”上海财经大学特聘教授胡延平告诉《每日经济新闻》记者,当价格优势不再突出,模型的产品力便成为左右用户选择的关键。

胡延平分析,上周美国AI大模型调用量回升,主要由Anthropic旗下Claude Sonnet和Opus模型拉动。这两款模型已成为编程领域的“硬通货”,而国产大模型在这方面的产品力仍需提升。

OpenRouter数据显示,上周,Claude Sonnet4.6冲上榜首,周调用量达1.38万亿Tokens,环比增长19%。Claude Opus4.6位居第三,周调用量达1.22万亿Tokens。两款模型合计占美国AI大模型周调用量逾五成。

与此形成对比的,是近期国产模型的过山车行情。

在此前一周(4月6日至12日),阿里Qwen3.6 Plus以1.66万亿Tokens的周调用量居全球榜首,但仅过一周(4月13日至19日)便下滑出榜单。

此外,记者注意到,此前多次上榜的Kimi K2.5、智谱GLM系列模型,已连续三周未登榜。此前一度冲上榜单第二的阶跃星辰Step 3.5 Flash,近两周同样无缘榜单。

胡延平认为,OpenRouter平台的用户以开发者和中小企业为主,对模型迭代能力和垂直场景产品力要求极高。“市场用户有往头部主力模型集中的趋向,在能够触达的范围内,用户只用最好的。”他指出,用户场景越来越要求模型具备强工具调用能力、多Agent(智能体)支持、长程复杂任务的持续达成能力,目前OpenRouter上的大部分模型在这方面还需着力提升。

有业内人士也向《每日经济新闻》记者指出,算力成本上涨后,行业内普遍优先选择性能稳定、输出效果可靠的工具,价格已非首要考量。

02 算力涨价的根源:需求 “海啸” 撞上供给 “天花板”

这场 AI 算力涨价,不是短期波动,而是供需彻底失衡的必然结果,核心是需求指数级爆发,供给却被物理瓶颈死死卡住。

1)需求端:AI 智能体引爆,Token 消耗 “千倍增长”

2026 年 AI 行业最大的变量,是 **AI Agent(智能体)** 的规模化爆发。以爆款应用 OpenClaw(“龙虾”)为代表,智能体彻底改变了 Token 消耗逻辑:

– 传统模式:人机一问一答,Token 消耗线性增长,单次对话仅数十至数百 Token;

– Agent模式:自主拆解任务、多轮迭代、自我纠错、反复调用工具,单任务 Token 消耗暴涨 1000 倍。

数据更直观:今年 3 月,我国日均 Token 调用量超 140 万亿,较 2024 年初增长超 1000 倍。一个普通智能体运行一天,算力成本就高达 1000-5000 美元;甚至有企业吐槽,“200 美元订阅费的用户,每月消耗 5000 美元算力”,完全 “卖得越多亏得越多”。

2)供给端:硬件、产能、能源三重 “硬约束”

需求狂飙,但算力供给却被物理世界牢牢锁死:

– GPU 芯片极度稀缺:英伟达 Blackwell 芯片时租 4.08 美元,两月涨 48%;H100 年租价从 1.7 美元 / 小时涨至 2.35 美元,涨幅近 40%;B200 租价达 5.47 美元 / 小时,环比涨 23.5%。高端 GPU 订单排至 2027 年,有钱也租不到。

– HBM 内存价格翻倍:作为大模型核心存储,HBM 产能不足,2026 年一季度价格直接暴涨 90%。

– 先进封装与能源瓶颈:英伟达 CoWoS 封装需求年增 40%,产能严重不足;同时,AI 算力耗电极增,多地出现电力供应紧张,进一步限制算力扩张。

无限需求撞上刚性供给,算力从 “普惠资源” 变成 “顶级稀缺资产”,涨价成了唯一出路。

03 用户“用脚投票”:国产模型遭遇“过山车”

面对上涨的Token价格,最敏感的开发者和中小企业开始“用脚投票”。

以前,大家看谁家搞促销、送Token就用谁家;现在,Token成了真金白银的生产资料,价格不再是唯一标准,性价比和硬实力才是关键。

1)OpenRouter的数据揭示了残酷的现实:

在4月的第二周,阿里的Qwen3.6 Plus还曾以1.66万亿Tokens的调用量登顶全球榜首;仅仅一周之后,它就跌出了榜单。与此同时,Kimi K2.5、智谱GLM系列等曾经的明星模型,已连续三周消失在主流视野。

2)取而代之的是谁?是能“干活”的模型。

数据显示,美国模型的反弹完全由Anthropic旗下的Claude Sonnet和Opus拉动。这两款模型已成为海外编程领域的“硬通货”,无论是代码生成还是复杂逻辑推理,用户认为哪怕贵一点,只要产出稳定,就是划算的。

04 谁在为算力涨价买单?四层成本传导,全行业承压

算力涨价的成本,不会凭空消失,而是沿着产业链层层传导,从厂商到企业、从开发者到个人用户,最终由全行业共同承担,只是承担方式与压力各不相同。

1)第一层:云厂商与模型企业 ——“被迫涨价,修复利润”

过去两年,AI 行业陷入 “低价内卷”:云厂商靠补贴抢客户、大模型企业烧钱换流量,长期 “亏损获客”。

涨价对它们而言,是 **“被动自救”**:

– 缓解 GPU、HBM 的巨额折旧与采购压力,从 “规模优先” 转向 “价值优先”;

– 把稀缺算力向高毛利、高价值的企业客户集中,淘汰低价值的个人粗放调用;

– 头部厂商(如拥有自研芯片的企业)反而受益,成本优势进一步拉大,加速行业出清。

2)第二层:中小企业与开发者 ——“成本暴增,生死考验”

这是最直接的承压层。绝大多数中小 AI 企业、独立开发者没有自建算力能力,完全依赖云端 API 与算力租赁:

– 创业公司:AI 应用成本直接上涨 30%-200%,利润被大幅挤压,“PPT 创业” 彻底失去土壤;

– 中小开发者:低价调用时代终结,大量个人项目、低价值应用因成本过高直接停服;

– 行业分化:能靠 AI 创造高营收(如电商 AI、企业 SaaS)的企业尚能承受,纯工具、低变现项目直接被淘汰。

3)第三层:重度用户与企业客户 ——“转嫁成本,优化使用”

对大型企业、AI 重度用户而言,涨价是 **“成本转嫁 + 效率优化”**:

– 一方面,将上涨的 AI 成本部分转嫁给终端客户(如 AI 增值服务提价);

– 另一方面,主动优化 Token 使用:减少无效调用、精简上下文、切换更高能效的模型,倒逼 “精细化运营”。

4)第四层:普通个人用户 ——“感知有限,体验分化”

个人用户感受相对间接:

免费额度缩水、免费模型质量下降、付费订阅价格上涨;

大量低质低价的国产模型服务下架,反而倒逼用户转向更优质、更稳定的头部模型,“劣币驱逐良币” 的现象被逆转。

一句话总结:算力涨价的单,最终由 “全行业共担”—— 低效产能被出清,高效玩家留到最后,行业从 “野蛮生长” 走向 “高质量发展”。

05 专家:全球消耗量仍处快速增长通道

短期数据波动,是否意味着AI应用热潮正在消退?

“短期还不宜下结论。”胡延平提醒,OpenRouter的Token调用量仅占全球消耗总量的约2%~4%,其排名波动更多反映的是开源、二线及新发模型的竞争态势,不能代表整个市场的走向。

事实上,成本压力正在倒逼市场进化。胡延平观察到,今年初以来,OpenClaw等各类智能体、多Agent应用已将Token调用量拉升至去年底的两三倍水平;成本大幅抬高,促使企业和用户转而采用记忆优化、提示词压缩、Harness Engineering(约束工程)等手段主动降耗。

记者了解到,甚至有中小创业者已将Token使用量纳入员工绩效考核。市场正从单纯追求数量的“堆量”阶段,进化到追求更高投入产出比的“提效”阶段。

更深层的变化,在于AI应用场景本身的质变。国联民生证券一份研报中提出“Token通胀”的概念。这并非指Token本身变贵,而是指单位时间内、单位用户的Token消耗结构性上升。

用户的需求正从浅层的“问答”转向深度的“干活”。Token不是传统互联网时代边际成本几乎为零的“流量”,而是执行生产任务时必不可少的“燃料”。

摩根大通在研报中对中国市场作出极为乐观的预测,预计2025年至2030年,中国Token消耗量的年复合增长率将达330%,5年内将实现370倍增长。

胡延平同样对长期趋势保持坚定乐观:“就中长期而言,无论OpenRouter上的统计数据如何波动,包括中国在内,全球Token消耗总量都处在快速增长通道,未来两三年会有数十倍甚至数百倍的增加。”

涨十周、降两周,看似是数据波动,实则是 AI 行业的一次深刻 “压力测试”。

算力涨价,挤掉了行业的虚假繁荣,淘汰了低效产能与投机者,留下真正有技术、有场景、有商业化能力的玩家。Token 调用量的收缩,不是 AI 的终点,而是理性发展的起点—— 当每一分算力都用在 “创造价值” 上,AI 才能真正从 “概念热潮” 走向 “产业刚需”。

至于 “谁为算力涨价买单”?答案是:所有人,但也只有扛过成本压力、守住价值底线的人,才能笑到最后。

这场 AI 算力的 “大通胀”,才刚刚开始。

相关新闻

  • 企业定制系统打通飞书、钉钉、企业微信:不是锦上添花,是刚需

    企业定制系统打通飞书、钉钉、企业微信:不是锦上添花,是刚需

    上个月一个做连锁餐饮的老板跟我吐槽:花了小三十万搞了套巡店系统,督导们死活不用。催了仨月,后台数据还是稀稀拉拉。他特郁闷,问我是不是被开发商坑了。 我让他把系统打开看了看,功能没毛病,界面也过得去。问题出在哪?督导在外面跑,手机上成天挂着的是企业微信,要用巡店系统得单独打开另一个App,登录、找入口、传照片,来回倒腾。人家嫌烦,拍完照片直接往群里一丢,回头想起来再补录。甚至有些人压根就不补了。 系统没人用,八成不是系统的锅。是它离员工太远了。 你的系统再好,也干不过员工的使用惯性 说句大实话:你…

  • 传统ERP和新一代ERP的区别是什么?AI智能化ERP系统开发如何碰撞出火花?

    传统ERP和新一代ERP的区别是什么?AI智能化ERP系统开发如何碰撞出火花?

    简单来说,ERP系统是一套集成的企业管理软件,它就像企业的“中枢神经系统”,将公司内部所有核心部门(如财务、采购、生产、销售、人力资源等)的数据和业务流程连接在一个统一的数据库中,实现信息实时共享和流程自动化。 01 核心概念:为什么要用 ERP? 在没有 ERP 之前,企业的各个部门通常使用独立的软件或 Excel 表格管理数据: ① 财务部有自己的账本; ② 销售部有自己的客户名单; ③ 仓库有自己的库存表。 痛点:数据不互通(形成“数据孤岛”),信息滞后,容易出错。 例如,销售卖出了货,但…

    新闻中心 2026-03-09
  • AI Agent 到底是怎么干活的?一文弄懂AI Agent完整工作流程

    AI Agent 到底是怎么干活的?一文弄懂AI Agent完整工作流程

    想象一下,你告诉AI:“帮我策划一个下周末去杭州的两天一夜旅行,预算2000元,要包含高铁票和一家评分4.5以上的酒店,然后把行程发到我的邮箱。” 如果是在几年前,你可能会得到一个包含各种链接和文字建议的回复。但今天,一个真正的AI Agent(智能体)会怎么做? 它会像一个经验丰富的私人助理一样,默默地开始工作:查询下周末的高铁班次、比较价格和余票;搜索杭州的酒店,并根据你的预算和评分要求进行筛选;将选定的交通和住宿信息整合成一个清晰的行程表;最后,将这个行程表打包发送到你指定的邮箱。 这一切…

    新闻中心 2026-04-15
  • AI视觉缺陷检测技术落地方案-塑料注塑件外观质检

    AI视觉缺陷检测技术落地方案-塑料注塑件外观质检

    1. 方案概述 本方案针对塑料注塑件(手机外壳、家电面板、汽车内饰塑件等)的外观质量管控需求,基于AI视觉+多角度成像+边缘计算技术架构,实现飞边、缩水痕、划伤、顶白、色差、异物六大类缺陷的自动化高精度识别。 其中飞边、缩水痕、顶白列为严重缺陷,执行100%全量检出标准,杜绝漏检;划伤、色差、异物实现精准识别与分级告警,替代人工目视检测,提升检测效率、一致性与质量管控水平。 方案采用”顶拍+侧拍+背光”三路成像布局,搭配白光、环形同轴光双光源互补成像,依托边缘计算盒实现本…

  • 2026年4月AI大模型排名:谷歌登顶,国产模型全面崛起

    2026年4月AI大模型排名:谷歌登顶,国产模型全面崛起

    如果你最近还在用半年前选定的AI模型做业务,可能要重新看一看了。 Artificial Analysis 每72小时更新一次的 LLM 排行榜,目前已收录 317 个模型。这张榜单不是看论文发表数量,也不靠厂商自报,而是从实际 API 调用中采集智能指数、响应速度、成本和延迟这几个维度的实测数据。换句话说,它大致反映了”花钱买到的模型到底怎么样”。 智能指数前五,格局已经变了 排行榜的核心是”智能指数(Intelligence Index)”,满分…

    新闻中心 2026-04-13
  • AI原生嵌入ERP:智能体+大模型正在改变企业管理系统的底层玩法

    AI原生嵌入ERP:智能体+大模型正在改变企业管理系统的底层玩法

    上个月跟一个做五金配件的老板聊天,他说了句特别实在的话:”我花了两百万上ERP,现在最大的感受就是——以前手工记错账,现在系统里记错账。” 他不是在否定ERP的价值。流程确实规范了,数据确实集中了。但业务员每天花大量时间在系统里录单、翻菜单、跨模块找数据,干的全是”伺候系统”的活。ERP本来应该是工具,结果活成了负担。 这个问题不是个例。很多企业的ERP系统用了五年八年,流程跑得通但效率上不去。不是系统不行,是它太”死”了—…

  • 云智能实验室管理系统:如何利用AI让多项目研发变得井然有序

    云智能实验室管理系统:如何利用AI让多项目研发变得井然有序

    最近,某企业研发总监告知已经开了三个项目复盘会。生物组抱怨隔壁化学组老是用错公共区的移液枪;两个并行项目因为人力冲突导致节点延误;最关键的是,当投资人问起某个核心管线的实验数据溯源时,团队花了整整一天才从五个不同的Excel和两个纸质记录本里拼凑出报告。 这不仅是研发总监的困境,也是无数多项目研发团队的缩影。当项目从1个变成N个,资源、数据、流程就像散落一地的拼图。 那么,有没有一种方法,能让多项目研发从“一团乱麻”变成“井然有序”? 答案是:AI云智能实验室管理系统。 01 多项目研发的典型痛…

    新闻中心 2026-03-03
  • 企业合同与客户信用风险管理系统:打造信用驱动的合同全生命周期风控平台

    企业合同与客户信用风险管理系统:打造信用驱动的合同全生命周期风控平台

    企业合同和客户信用风险管理系统是为企业中高级管理人员和业务管理部门建立的综合风险控制平台。系统围绕“客户信用”的核心变量,开放合同管理、收款控制、人员证书合规管理和风险预警中心,构建可追溯、可控、可预警的数字风险管理系统。 系统的主要功能包括: 合同全生命周期管理,包括合同的起草、审核、签订、暂停、终止、续订等 客户信用驱动型收款策略控制,每个客户都有自己的信用度,信用度会随着合同的执行情况变化调整 人员与证书合规管理,自动合规验证和证书生命周期管理 统一风险预警中心 人工智能协助条款风险识别与…

  • 上海软件开发公司:AI Agent开发找哪些公司?

    上海软件开发公司:AI Agent开发找哪些公司?

    在数字化转型浪潮席卷全球的今天,AI Agent(人工智能代理)已成为企业智能化升级的核心引擎。无论是智能客服、自动化流程、数据分析助手,还是个性化推荐系统,AI Agent正悄然改变着各行各业的运作方式。作为中国科技创新的前沿阵地,上海汇聚了一批在AI Agent开发领域领先的软件公司。如果您正寻找专业的AI Agent开发服务,本文将为您梳理上海值得关注的几家优秀企业。 一、什么是AI Agent?为何它对企业如此重要? AI Agent是能够感知环境、自主决策并执行任务的人工智能系统。与传…

    新闻中心 2025-12-14
  • AI时代还需要定制开发软件吗

    AI时代还需要定制开发软件吗

    AI大模型正在快速改变软件生产方式,很多企业开始问同一个问题:既然AI已经能自动写代码,为什么还要投入软件定制开发和系统定制开发?表面看,AI让开发更快了;但站在企业决策层的角度,真正要解决的不是“能不能写出代码”,而是“能不能支撑业务长期增长、稳定交付、可控维护”。 如果你的系统只是一次性工具,标准化产品也许够用;但一旦涉及多部门协同、复杂流程、数据治理、权限控制、合规要求和未来扩展,AI大模型只能提高效率,不能替代架构设计、业务抽象和工程管理。换句话说,AI时代不是不需要定制开发,而是更需要…

    新闻中心 2026-04-07
在线沟通
客服微信
客服微信
在线咨询
联系我们

联系我们

400-103-7662

售前咨询邮箱:
sales@king-v.com

工作时间:
法定工作日 9:00-18:00

返回顶部