日期:2026-06-03 08:58:32
美国大厂开始算AI的账了 高昂Token费引发焦虑。最近刷朋友圈和技术群,发现风向在转。去年大家聊AI,开口闭口「10x工程师」「生产力核爆」。现在越来越多人在讨论同一件事:Token费用太高,这个月的AI账单又炸了。

5月底,Uber COO Andrew Macdonald在播客里提到,公司在AI上的花费越来越多,但消费者端真正好用的功能并没有相应的产出。他说:“Token的消耗量确实在激增,但这种高昂的投入与终端用户体验的实质性提升之间,尚未建立起清晰的逻辑关联。目前很难在AI成本支出与功能产出之间,划出一道令人信服的等号。”这段话在技术圈传开后,不少开发者表示,心里那股焦虑终于被人讲出来了。

对于天天敲代码、做项目的人来说,AI这笔账到底怎么算?Token在燃烧,大厂的AI账单开始反噬了。2026年5月底,Uber运营主管Andrew Macdonald直言公司AI花费越来越高。更早之前,Uber CTO Praveen Neppalli Naga在接受采访时透露,公司2026全年的Claude Code预算,4月份就已经烧光了。这件事在内部引发了一场大讨论,核心矛盾在于疯狂燃烧的Token账单和持续膨胀的人力成本并没有换来预期的增长,消费者端真正落地的功能甚至没有多出25%。

类似的情况在其他公司也出现。据Axios报道,一家大客户单月在Claude上花掉了5亿美元,只因公司没有给员工的许可证设用量上限。同一时间,微软被曝取消了大部分Claude Code许可证,转向更可控的内部方案。CloudBees CEO Anuj Kapur说得更直白:裁员可能是企业抵消AI账单的唯一手段。这些事件表明,AI确实顺手,但账单寄到CFO桌上的时候,情况就变了。

把视野从Uber一家拉到整个行业,2026年大厂们在AI上的押注已经到了让人喘不过气的规模。Amazon、Microsoft、Google(Alphabet)、Meta以及Tesla等,今年AI相关的资本支出预计达到6500到7500亿美元。这些钱主要砸在数据中心、GPU和海量服务器上。高盛等机构预测,Agentic AI时代到来后,Token消耗量可能再翻24倍。
但华尔街的耐心正在消耗。多家投行分析师预测,2025到2030年间,大部分hyperscaler的AI资本回报率大概率是负的,只有少数能勉强回正。Gary Marcus在Substack上连发数文,质疑生成式AI的经济性,称2026年为清算年。他认为炒作太多,真实商业价值太少,Scaling Law已经跑到了边际递减区间。如果更多财富500强公司报出类似Uber的“高投入、低产出”,泡沫就该破了。
当然,也有人不悲观。Yann LeCun和Andrew Ng都表达过类似判断:AI会改变世界,但当前这条无限堆算力、无限烧Token的路必须调整。更高效的架构、更聪明的数据利用,才有出路。
大厂在算总账,这种压力很快就会沿着产业链传导下来。云厂商开始调整API定价模型、收紧配额、砍掉无限量套餐。最先感受到这股寒意的是每天坐在终端前面、一行行调prompt的开发者。个人的AI账单已经藏不住了。
2026年的AI编码工具定价非常透明,Cursor Pro、Claude Pro基础版20美元一个月起步。但只要开了Agent模式或者Claude Code Max,月费轻松冲到100到400美元。直接调API用Opus级模型的话,一个复杂项目的调试跑下来,单次几美元到几十美元很常见。一个做SaaS的开发者上个月AI写新功能,Token费花了280美元。功能上线了,但代码review花的时间比以前还多。整体开发效率确实提了,但边际收益在递减。
很多独立开发者都在反馈同一个现象:做多文件重构、长上下文Agent任务时,重复加载上下文和无效循环修正,能吃掉30%到60%的Token。你以为买的是生产力,实际有三成到一半都在空气里烧掉了。研究也印证了这一点,在有经验的开发者身上,AI辅助有时候反而拉长了完成时间,纠错成本太高。AI把初级活干了,架构、审查、调试这些高级活还是得人来。审查AI代码,有时候比自己从头写还累。
既然避免不了燃烧token,那就想办法让它花得更值吧。下面这些方法来自几个重度用户的实战总结,能把月费砍掉一半以上。中型功能重构(涉及5到8个文件,含调试循环)优化前,全程Opus顶级模型,每次调用重新加载完整上下文,一次任务平均烧掉18万token。一个月做12个类似任务,总Token约216万,单月成本约25美元。这还只是API费用,加上订阅基础费,实际账单更高。优化后做了两件事:文件导航和模板代码切到Haiku,核心逻辑用Sonnet,只有架构决策才上Opus;稳定system prompt加代码库前缀做缓存,重复输入只收10%费用。同样任务的Token降到5.5万,单月成本约6.8美元,节省了73%。
一个开发者按这个思路,把每月340美元的Cursor账单压到了85美元上下,交付速度反而没掉。少了无效循环,效率反而高了。中型重构能省这么多,高频小任务其实更容易失控。每天补几个函数、写几组单测、修几个不痛不痒的bug。默认Sonnet、全量上下文、不开缓存,一个任务随便就烧掉4.5万token。一天15个、月工作22天,总token直奔1500万,月成本280到320美元,重度用户大多落在这个区间。如果80%的琐碎活切到Haiku加缓存,prompt里写“只输出代码,不解释”,Token直接压到原来三分之一,月成本降到65到85美元,节省了约75%。
两种场景,算完账就清晰了。把反复验证过的技巧提炼出来:模型分层,简单活Haiku,日常Sonnet,复杂架构才上Opus。别拿牛刀杀鸡。Prompt Caching,重复上下文缓存能省75%到90%的输入费用。system prompt、代码库前缀,这些固定内容一定要缓存。本地模型混用,隐私敏感或高频简单任务,用Ollama跑Llama 3.1 或DeepSeek,成本压到每月50美元以内。设token上限,用治理工具给单次会话设天花板,防止Agent跑飞了还在烧。把AI当实习生,它产出代码,你来把关架构和业务逻辑。审查这一步不能省。
对中国开发者来说,还有一个额外的选项。国产大模型在成本和合规上越来越能打,边缘部署和混合云方案也在快速成熟。未来企业很可能更偏好「够用、便宜、可控」的组合,纯押国外闭源顶级模型不再是唯一的路。
最近这股从狂热转向焦虑的情绪,有点像从一个极端跳到了另一个极端。去年FOMO到什么都上AI,今年一看账单又集体紧张。历史反复证明,技术革命从来不是一条直线。互联网泡沫破裂后,死掉的是炒概念的公司,活下来的成了今天的巨头。AI也会走同样的路。能帮企业真正省钱、赚钱的技术,成本优化、可靠Agent、垂直领域应用,才会留下来。
对开发者来说,这段时间反而是个好时机。别被宏观叙事带节奏,沉下心把几件事做扎实:Prompt Engineering进阶、Agent编排、RAG系统构建;多模型混合部署和成本监控;最关键的一项是如何高效review AI代码,把AI输出转化成可靠产品。这个能力,2026年以后只会越来越值钱。
高亿配资提示:文章来自网络,不代表本站观点。