新浪新闻 国际

烧掉1万亿美元后,美国公司开始给DeepSeek充值

观察者网

关注
听新闻

(文/陈济深 编辑/张广凯)

5月底,美国企业支出管理平台Ramp的首席经济学家阿拉·卡拉齐安(Ara Kharazian)做了一个预判:美国企业管理AI支出会越来越精打细算,会更多尝试开源模型,或者OpenAI、Anthropic和谷歌家更便宜的低配版本。

一周之后,他自己平台的数据给出了一个超出预判的答案。

6月3日,Ramp发布6月软件趋势榜,登顶的是DeepSeek。

Ramp发布的2026年6月软件供应商趋势榜,DeepSeek登上代表突破性增长的“Trending”榜首(红框为媒体标注)。图源:Ramp Economics Lab

“我没有料到美国公司会去用DeepSeek。”卡拉齐安在报告里写道。

Ramp公司负责替5万多家美国企业管企业卡和对公账单,每个月经手数十亿美元的开支。它的软件趋势榜负责统计哪些软件供应商正在被企业第一次付款,增速最快。这张榜单过去的常客是Figma、Fireworks AI这类硅谷自己人,一家中国模型公司登顶,是头一回。

付款记录里还有一个更隐藏的细节。这些美国公司没有走下载开源权重、本地部署模型的思路,而是直接向DeepSeek付费。

“说得明确一点:这不只是自部署的开源使用。企业在直接通过DeepSeek收发数据。”卡拉齐安特意强调了这一点。

他补充表示称,这可能是迄今为止最明显的信号,说明美国企业正在寻找OpenAI和Anthropic的低成本替代品,一些公司愿意用更便宜的中国模型,“让美国的数据在中国托管的服务器之间来回传输”。

这不是DeepSeek第一次出现在美国企业的账本上。2025年1月,R1发布引爆全球,DeepSeek的应用一度超过ChatGPT登顶美区App Store免费榜,在Ramp当时的数据榜单里,美国企业对DeepSeek的采用率同期冲到0.3%,随后很快回落到0.1%。

如果说2025年初更像是企业跟着舆论热度的一次集体试用。那这一轮企业们又用回了DeepSeek的核心变化在于动机:AI账单的财务压力。

Uber四个月烧光了全年Token预算

美国企业的AI账单有多难看,已经不再是行业内才知道的秘密。

咨询公司贝恩近期调查了全球951家年收入超过1亿美元的企业,结论相当不客气:在企业AI累计支出突破1万亿美元之后,AI带来的实际成本节约普遍远低于预期;更扎眼的是,44%的大型企业正在用“上一轮AI尚未兑现的费用节省”来论证下一轮AI投资的合理性。贝恩把这种操作定性为“一个存在结构性漏洞的循环赌注”。

落到具体公司,数字则更加夸张,打车巨头Uber透露,仅2026年前四个月,公司就耗尽了全年的Token预算;Salesforce表示,今年支付给Anthropic的费用将达到约3亿美元。

科技巨头同样开始捂钱包:亚马逊叫停了内部的AI使用排行榜,原因是员工为了刷排名刻意执行不必要的任务、推高Token消耗;微软则计划在6月末前,逐步停用多个关键产品部门员工的Claude Code订阅。

当亚马逊都开始心疼Token的时候,成本就不再是创业公司才需要操心的问题了。

而美国企业花钱最多的,恰好是费用最贵的两家AI大模型公司。

Ramp自家的AI指数显示,Anthropic和OpenAI在美国企业中的付费采用率分别达到34.4%和32.3%,Anthropic还是首次反超OpenAI。这两家的旗舰模型定价长期站在全行业最高一档,企业的AI支出大头,几乎就是给这两家的账单。卡拉齐安那番“成本纪律”的判断,说的正是这个处境:钱已经花出去了,回报迟迟没到,财务部门开始挨个审视每一行AI开支。

对于企业而言,省钱的路无非两条,要么少用,要么换便宜的。亚马逊和微软选了前者。趋势榜上的那批公司,选了后者。

把价格打到四分之一,开发者先投了票

就在美国企业被高额AI账单困扰时,DeepSeek5月刚好递上了一个很难拒绝的报价。

5月22日,DeepSeek宣布旗舰模型V4-Pro的API价格永久下调至原价的四分之一:限时优惠结束后,每百万Tokens输入价格低至0.025元(缓存命中)、3元(缓存未命中),输出6元,再次刷新全球主流大模型的底价纪录。

根据第三方测算,在相同任务复杂度下,V4-Pro的平均调用成本约为GPT-5.5的十分之一,约为Claude Opus 4.7的十一分之一。

低价对DeepSeek来说不是新策略。早在2024年V2降价引发国内大模型价格战时,创始人梁文锋就在接受采访时讲过定价原则:核算成本后定价,“不贴钱,也不赚取暴利”,降价的底气来自下一代模型结构带来的成本下降,“API和AI都应该是普惠的、人人用得起的东西”。

如果说当时这番话听起来像一家中国创业公司的自我要求,那么两年后,DeepSeek的普惠定价开始在美国公司的对公账户落地。

而在企业掏钱之前,开发者群体已经对DeepSeek投下了自己的信任票。

全球模型聚合平台OpenRouter的数据显示,5月18日至24日当周,DeepSeek V4-Flash以3.43万亿Tokens的周调用量登顶全球第一,DeepSeek旗下模型周调用总量达到5.74万亿Tokens,超过Anthropic与谷歌,连续两周位居全球厂商第一。同期整个中国模型阵营的周调用量达到9.22万亿Tokens,连续四周压过美国模型的4.93万亿Tokens。OpenRouter的用户以海外开发者为主,中国开发者只占约6%,这份榜单上的每一笔调用,基本都来自海外开发者的真实选择。

OpenRouter“本周”模型调用榜,DeepSeek V4 Flash 位列第一;前十里还有腾讯、MiniMax、小米等多家中国模型。图源:OpenRouter

开发者用脚投票在先,企业用预算跟进在后。对企业软件来说,这条“开发者先用、公司后买”的路径再经典不过,过去二十年,AWS、GitHub、Slack都是这么走进美国企业的,只不过这一次,走这条路的是一家中国的模型公司。

中国模型进入美国公司,DeepSeek不是第一个,也不是唯一一个。早在2025年底,Airbnb的CEO布莱恩·切斯基就公开说,公司“大量依赖阿里巴巴的Qwen模型,它又好又快又便宜”,OpenAI的模型反而“在生产环境里用得不多”,这番话今年还招来了美国众议院的问询。

今年3月,估值近300亿美元的AI编程工具Cursor推出新模型Composer 2,发布24小时内就被开发者扒出底座是月之暗面的Kimi K2.5,联合创始人阿曼·桑格(Aman Sanger)事后承认,“一开始没在博客里说明基于Kimi,是个失误”。

这些公司用中国模型的方式,和DeepSeek这一次不一样。Cursor用的是Kimi的开源权重做二次训练,Airbnb的Qwen也是自己部署,切斯基反复强调“我们没有向任何中国公司提供数据”。它们调用的是中国开源模型的能力,钱并没有进中国公司的账。

而Ramp这次记录到的是另一回事,美国公司在直接给DeepSeek付费,数据也直接经DeepSeek进出。从“拿开源权重自己跑”到“付钱直连托管”,这才是6月这张榜单真正的新意,也正是卡拉齐安特意点明“这不只是自部署”的原因。

这次能够不一样吗?

对于DeepSeek冲上美国企业订阅榜的结论,卡拉齐安在报告里补了一段:“我不会高估这个趋势的持久性。对企业来说,直接接入DeepSeek存在真实的竞争与安全顾虑。”

美国企业直接把数据发给一家中国公司的服务器,合规部门不可能没有意见。这层顾虑是真实的,也未必是DeepSeek短期能解决的。

但卡拉齐安这段话的后半句,分量不比前半句轻:“美国模型公司无论如何都应该注意到这种竞争压力,用更便宜的模型,或者用智能路由,帮企业管住不断失控的AI支出。”

简单翻译一下:即便美国企业明天就因为安全顾虑集体退掉DeepSeek,逼它们走到这一步的成本压力也不会消失,OpenAI和Anthropic的定价体系照样要回答这道题。

何况趋势榜上的信号不只DeepSeek一个。同月上榜的还有Fireworks AI、fal、DeepInfra这批开源模型推理平台,美国企业在整体性地转向开源和低成本方案,DeepSeek只是这场迁徙里最显眼、也最让人意外的那个目的地。

便宜也可能是另一段麻烦的开始。进入Agent时代,一个任务要反复调用模型、自己写代码、自己跑测试、自己纠错,吞掉的Token是过去一句一答的几倍甚至几十倍。测算显示,当Agent的渗透率爬到8%,它消耗的Token就追平了聊天机器人,往后还有5倍以上的空间。单价降到四分之一,调用量翻上十倍,账单只会更厚。DeepSeek的低价把更多公司请进了门,也把它们更深地推进了这场停不下来的消耗。

一年半前,DeepSeek-R1发布引爆全球,那个“约560万美元训练成本”的故事让硅谷集体恐慌,英伟达单日蒸发近6000亿美元市值。

尽管当时DeepSeek对股市的恐慌一周就能平息,但如今愈发压力山大的AI预算压力,每个月都会准时拷问所有的美国企业。

责任编辑:陈琰 SN225

加载中...