新浪新闻

又一美国科技巨头,悄然转向中国大模型

观察者网

关注
听新闻

美国科技企业正在悄然将中国开源AI模型纳入生产基础设施。

随着顶尖美国模型服务成本持续攀升,以美国加密货币交易所Coinbase为代表的企业开始以中国开源模型作为默认选项,以此在不压制使用量的前提下大幅压缩AI开支。

Coinbase首席执行官Brian Armstrong上周末在社交平台X发文披露,公司已通过内部LLM网关,将智谱的GLM 5.2和月之暗面的Kimi K2.7设为全体工程师的默认大模型。

尽管没有披露具体数字,但是Armstrong表示,在Token使用量持续指数级增长的同时,通过换默认模型、智能路由、强化缓存,使得Coinbase的AI支出已被压缩近一半,并强调任何公司都可以照搬实现降本增效。

他同时披露,公司91%的工程师从未触及原有的用量上限,因此本次成本优化并没有下调员工Token额度、而是把代码审查、文档总结等常规任务的默认模型,从Anthropic、OpenAI的前沿模型换成两款来自中国的开源模型。

GLM 5.2是智谱6月12日公开、随后以MIT协议开放权重的旗舰模型。在被广泛引用的第三方评测Artificial Analysis上,它成为当前得分最高的开源权重模型,并跻身全球前列;

GLM 5.2在SWE-bench Pro等指标上超过OpenAI的GPT-5.5,在FrontierSWE等任务上接近Anthropic的旗舰模型Opus 4.8。作为能在大量高强度工程任务里与闭源前沿模型同桌竞争的开源模型,它的调用价格,只有Opus 4.8的几分之一。

月之暗面的Kimi大模型也在近期持续在海外市场打出声量。

近期被马斯克以600亿美元收购的美国AI编程工具公司Cursor,在今年三月被爆出自研模型Composer 2“套壳”Kimi K2.5模型。

公司的年度经常性收入(ARR)从今年3月的约1亿美元翻倍到4月的2亿美元以上,海外API收入自去年11月以来涨了约四倍;

资本市场随之跟进,月之暗面的估值在半年内从43亿美元飙升至200亿美元。Coinbase默认调用的Kimi K2.7 Code,正是Kimi在6月12日发布的最新代码模型。

Coinbase的案例并非孤例,在美国企业AI开支普遍失控的背景下,越来越多美国公司把负载转向中国开源模型。

继去年Airbnb将客服模型从GPT切换到千问(Qwen)后,近期美国AI公司Lindy把模型从Anthropic Claude迁到DeepSeek V4,此前其AI开支已超过员工工资总额;Snowflake的首席执行官测算后认为,GLM 5.2能以低得多的价格做到与Claude相当的性能。

美中经济与安全审查委员会今年3月的一份报告估计,约80%的美国AI初创公司在使用中国开源模型;在OpenRouter上,中国模型的Token份额也已从一年前的不到2%,升至今年4月的四成以上。

阿里巴巴千问(Qwen)系列的累计下载量更在今年1月突破7亿,并在Hugging Face累计下载量上超过Meta的Llama,成为全球下载量最高的开源模型家族之一。

而在展示AI大模型调用的平台OpenRouter上,来自中国的大模型长期占据了榜单的第一梯队。

值得额外关注的是,这一切发生在中美围绕AI持续摩擦的背景下。智谱2025年1月就被美国商务部以“助力中国军事现代化”为由列入实体清单,是首家上榜的中国大模型公司;

月之暗面则在今年2月被Anthropic公开点名,指其与DeepSeek、MiniMax一道通过虚假账号“蒸馏”Claude,今年6月Anthropic又指控阿里巴巴的Qwen团队发起规模更大的蒸馏。

针对数据安全和国家安全等潜在的合规问题,Coinbase称已把开源权重下载到自有服务器自托管运行,代码和提问不会流向位于中国的API接口。

企业把工程负载默认交给中国开源模型,也正对西方前沿厂商的定价形成压力。

Anthropic已于6月1日向美国证监会秘密递交IPO招股书,其接近万亿的市场估值核心取决于企业付费金额的快速增长,而企业成规模地把日常负载迁向更便宜的中国开源模型,外界恐怕将视为其增长故事需要面对的核心风险。

高盛测算,全球Token消耗量到2030年还可能增至现在的24倍;在目前OpenAI、Anthropic等美国闭源厂商定价持续高企的背景下,若单Token成本不降,企业账单压力还会继续放大,而GPT 5.6和Claude Fable 5的封禁风波也使得模型的可获得性成为了企业需要考虑的核心问题。

当性能进入第一梯队的国产模型,和更低的价格同时摆上桌,摆在企业面前的选择就不再是意识形态问题,而是越来越具体的成本、性能和部署控制权问题。

加载中...