AI账单暴涨,实际效益难言:谁在助推“Token通胀”?

赛事精彩回顾与前瞻。

25条评论 2026年5月10日

开云专注kaiyun.com,为用户提供专业可靠的体验。

围绕开云官网,开云持续打磨更优质的服务。

开云深耕kaiyun领域,用心服务每一位用户。

在开云入口方面,开云提供贴心周到的支持。

赛事前瞻

开云以kaiyun.com为核心,带来高效便捷的体验。

想了解更多开云官网相关内容,尽在开云。

100万亿,这个数字后面跟着14个零,虽然庞大,但可能还不足以覆盖国人每日的Token消耗总量的一半。到了2026年上半年,从北京的中关村到加州的硅谷,科技公司的茶水间里最常听到的问题变成了:“你今天用了多少Token?”有人会回答几十万、几百万,甚至几千万。听到这些数字,路过的外卖骑手可能会觉得他们在夸大其词,或者脑子出了问题。然而,他们说的并非人民币,而是Token。

Token与实际货币之间存在巨大的数量差距,但Token数量的激增速度却非常惊人。有报道指出,一家国外公司在为员工批量开通Anthropic的Claude企业版时,未设置消费上限,导致一个月的账单高达5亿美元,约合人民币34亿元。

在国内,近期发生了一个与米哈游相关的案例。在其《崩坏》系列的技术团队负责人郑银河于2026年5月举行的阿里云峰会上透露,一名工程师在测试多Agent协作功能时,因未设置熔断机制,导致数十个智能体陷入循环调用,短短13小时就产生了200万元的Token账单。

然而,当被问及AI带来了哪些实际效益时,大多数人可能会感到尴尬。米哈游工程师耗费200万元Token的测试,其成本足以支付一个小型研发团队一个月的薪资,最终的产出却仅是无意义的“AI摸鱼”。或许,在企业中,只有人力资源部门完成了裁员的KPI,而老板则将节省下来的人力成本再次投入到AI建设和Token采购上。

Token的单位价值正在被稀释,消耗量呈指数级增长,投入与产出之间也出现了错位。作为AI时代的重要“硬通货”,Token正显现出典型的通货膨胀特征,其涨势之迅猛,甚至可能超过津巴布韦货币的贬值速度。那么,究竟是谁在助长这种“Token通胀”的趋势呢?

01 从鼓励使用到限制消费

2026年上半年,硅谷出现了一种名为“Tokenmaxxing”的现象,即最大化Token的使用量。大型科技公司不仅鼓励员工尽可能多地消耗Token,甚至将Token消耗量与绩效考核直接挂钩。

Meta公司内部设立了追踪8.5万名员工Token消耗的排行榜,并为排名靠前的员工授予“Token传说”、“缓存大师”等称号。亚马逊也推出了名为“KiroRank”的内部AI使用榜单,并将Token消耗数据纳入团队的绩效评估。英伟达CEO黄仁勋的言论更是火上浇油,他表示:“如果我的工程师消耗的Token价值达不到他们年薪的一半,我会深感忧虑。”

国内的科技公司也迅速跟进。腾讯在2026年3月启动了全员AI激励计划,为每位员工提供年均22万元的Token资源,涵盖Cursor、CodeBuddy等国内外多款工具,内部也一度出现了Token消耗排行榜。

不出所料,这些公司的AI账单也随之失控。在短短30天内,Meta员工消耗了60.2万亿Token,成本超过1亿美元。Uber仅用了4个月就耗尽了2026年全年的AI预算,管理层不得不紧急出台限额令,规定每位员工每月AI工具的使用费用不得超过1500美元。亚马逊也开始实施严格的Token限额管理,高级副总裁Dave Treadwell甚至亲自呼吁“不要为了使用AI而使用AI”。

就在上个月,腾讯内部也发布了额度调整通知:全员Token配额大幅削减,核心研发团队的月额度从之前的宽松状态收紧至7000元,而外包岗位的额度更是被砍至1000元。

从鼓励全员敞开使用到实施限额消费,短短三个月内,情况发生了180度的转变。究其原因,主要是不断飙升的账单让即使是财力雄厚的大公司也感到难以承受。正如OpenAI首席执行官山姆·奥特曼在近期的一次企业客户活动上所说:“今年年初,AI的运行成本还不是一个被提及的问题,现在它突然变成了一个巨大的问题。”

这背后是需求的爆炸式增长。国家数据局的数据显示,2026年3月,中国日均Token调用量已超过140万亿,而2024年初仅为1000亿,两年内增长超过千倍。从全球范围来看,这种增长趋势似乎并未出现放缓的迹象。高盛近期发布的一份报告预测,到2030年,全球每月的Token消耗量将比2026年增长24倍,达到约120千万亿(120 quadrillion)Token/月,其中企业级智能体是主要的增长动力。

Token账单的失控还带来了另一个副作用。为了弥补AI成本的巨大缺口,今年第一季度,海外十几家科技巨头裁员超过4万人,程序员首当其冲;而在国内,“630”成为了许多互联网从业者的共同“最后一天”。在Meta,几乎已经没有人需要手动编写代码;在国内的头部大厂,新增代码中高达90%由AI生成。AI代码生成率的飙升直接导致了对人员需求的下降,以及随之而来的职场动荡。

02 Token账单飙升的内幕

账单费用由“用量”和“价格”两个因素决定。然而,在这看似简单的公式背后,隐藏着两层不那么透明的成本推升逻辑,最终叠加导致了指数级的成本膨胀。

许多人存在一个误解:大模型的价格一直在下降,AI应该越来越便宜。实际上,这只说对了一半——便宜的通常是通用型轻量模型。然而,企业真正需要的编程、长上下文处理、复杂推理等高价值场景,其价格不仅没有下降,反而呈现出逆势上涨的趋势。

Anthropic推出的安全增强型模型Fable 5,其每百万Token的输入价格为10美元,输出价格为50美元,是同期Opus系列的两倍。国内的智谱AI也是一个典型例子。据天眼查信息,2026年第一季度,智谱AI伴随新模型的迭代,连续三次上调了核心API的价格,累计涨幅达到83%。其面向通用场景的GLM-4.7轻量模型,输入价格仅为2-4元/百万Token,输出为8-16元。但对于编程和Agent场景的GLM-5.2,输入价格上涨至8元,输出高达28元,两者价差最高可达4倍。

此外,腾讯云在2026年3月至4月经历了两次调价,其混元HY 2.0 Instruct模型的输入价格涨幅高达463%;MiniMax的核心模型价格也有30%-50%的上调。

与此同时,模型厂商的计费模式已从订阅制全面转向按量付费,这意味着厂商的收入直接与Token消耗量挂钩。这就形成了一个结构性矛盾:客户的目标是用最少的Token完成任务,而厂商的商业利益则天然倾向于让客户消耗更多的Token。

从实际数据来看,Token消耗量的增长并非线性,而是呈现出指数级增长。2025年底至今,AI产业最核心的变化是从对话式AI向智能体Agent的跃迁。AI不再是简单的问答式交互,而是发展为自主规划、循环调用、多轮纠错的复杂流程,Token的消耗也随之从线性增长转变为指数级膨胀。

Agent虽然能力强大,但据腾讯研究院分析,它隐藏着几类典型的低效消耗:一是“上下文陷阱”,智能体在每一步操作中都会重复带入历史对话、工具日志和文件内容,同一批信息被反复计费;二是“技能冗余”,一项对49个软件工程技能的基准测试显示,79.6%的技能对任务通过率没有提升作用,却可能带来高达451%的Token开销增长;三是多Agent的“沟通成本”,多个智能体在协作时,会不断重复任务背景、结论和套话,每一次对话都意味着重复计费;四是长任务的“熵增”,任务链条越长越容易偏离目标,而为了纠错又需要增加摘要、检查、回滚机制,进一步推高消耗。

这些损耗并非简单的叠加,而是呈现出乘积效应。一个复杂的多Agent任务,可能近一半的Token被用于内部协调、自我纠错和重复读取,真正用于生成有效内容的比例并不高。对于缺乏技术能力的企业来说,这更是一笔难以看清、无法算明的糊涂账。

03 错失变革的恐惧

如果说模型厂商的产品和定价策略是公开的“阳谋”,那么企业内部的Token消费则是一场自上而下的“自我消耗”。

企业普遍担心错过AI变革的浪潮,因此纷纷积极拥抱AI。这种压力自然会传递给每一位员工,尤其是在AI可能取代人工的阴影下,员工普遍将“会使用AI、多使用AI”视为一种安全感来源。

许多公司将AI代码生成率、工具使用时长纳入OKR考核,甚至上线全员可见的数据看板,以此来倒逼每个人增加Token消耗。一些原本可以通过搜索引擎或人工几秒钟就能解决的问题,如简单的邮件回复、基础代码片段、常规数据查询等,也被交给大模型处理——反正花费的不是自己的钱,用得越多就越显得“拥抱变革”。企业通过将Token消耗量与员工绩效挂钩,默认“使用了多少AI”等同于“创造了多少价值”,并愿意为此支付高昂的账单。

有人认为这是历史的必然。历史上每一次通用技术革命,都经历了类似的阶段。蒸汽机刚发明时,工厂主发现其成本不如使用马匹划算;电灯刚商业化时,其成本远高于煤气灯。

然而,不同之处在于,电力消耗能够产出切实可见、可量化的工厂效益。但Token换来的“智能”究竟创造了多少价值?目前来看,答案仍然难以量化。

据“晚点LatePost”报道,一位互联网大厂的技术管理者透露,其部门20多个人,一个月消耗5万元Token,但回顾下来却未能沉淀出几个可落地的成果。这笔钱相当于10名实习生的月薪,化作无形的Token后,甚至连清晰的产出物都没有。

企业普遍认为使用AI替代人工可以节省成本。但反常识的是,在许多基础场景中,使用AI反而比人工成本更高。国内一家人力资源服务商进行过测算:使用AI筛选并初评一份简历,Token加上系统成本约为1.2元/份,而雇佣兼职人员处理的成本仅为0.8元/份。类似的情况在数据标注、基础文案撰写、简单客服问答等领域也普遍存在。

AI还存在更隐蔽的成本。有软件公司的研发负责人反映,引入AI编程工具后,初级开发者的效率看似提升了,但高级工程师的审查工作量翻倍,线上故障的返工成本也增加了30%以上。综合计算下来,反而并不划算,而且员工的负担反而更重了。

这正是Token经济最核心的矛盾所在:Token消耗与价值创造之间,从来都不是简单的线性关系。消耗的Token越多,产出的价值并非就越大;相反,很多时候消耗的增长恰恰源于无效的循环、冗余的架构和盲目的焦虑。

04 结语

回到最初的问题,谁在推动“Token通胀”?这不是某个AI厂商的恶意营销,也不是个别员工的滥用浪费,而是我们所有人的共同作用。

从提供底层算力基础设施的GPU和存储供应商,到大模型架构本身固有的膨胀属性;从每一个担心错过AI浪潮而焦虑的企业,直到每一位害怕落伍的员工——我们所有人,共同推高了Token的消耗,导致了Token的贬值,也推高了那本日益增厚的AI账单。

每个人都在助推Token的通胀,而每个人又在自身推力的作用下,步履蹒跚。

开云专注kaiyun.com,为用户提供专业可靠的体验。

2026-07-03

围绕开云官网,开云持续打磨更优质的服务。

围绕开云官网,开云持续打磨更优质的服务。

12 Comments | Dec 17, 2020

开云深耕kaiyun领域,用心服务每一位用户。

在开云入口方面,开云提供贴心周到的支持。

12 Comments | Dec 17, 2020

围绕开云官网,开云持续打磨更优质的服务。

15条评论

体育爱好者A

2026年5月10日

开云官网,不仅是信息的汇聚,更是对体育精神的传递。我们关注赛场内外,为您呈现真实、生动的体育世界。

回复

赛事分析师B

2026年5月8日

探索最新体育热点,发现您钟爱的赛事。开云官网,让您与全球体育脉搏同步。

回复

资深球迷C

2026年5月5日

深入了解您关注的体育项目,从历史到未来,从规则到策略,尽在开云官网。

回复

运动达人D

2026年4月28日

体验开云官网的便捷与专业,获取您所需的一切赛事信息。

回复

发表您的看法

立即体验,尽享全球赛事精彩。

开云科技有限公司简单 · 可靠 · 贴心电话:+86 157 3329 3801邮箱:[email protected]微信:worldkaiyun_458