AI Agent时代CPU需求爆发成算力新瓶颈各方观点
观点组1: 全球服务器CPU供需严重失衡,涨价与产能售罄是AI Agent需求爆发与先进制程供给刚性共同导致的结构性现象
观点作者:英特尔
观点内容:尽管AI时代带来前所未有的半导体需求,但短期内我对未能完全满足市场需求感到遗憾;受超大规模云服务商扫货影响,2026年全年服务器CPU产能已基本售罄,为保障供应稳定,计划将价格上调10–15%,且Intel 10/7nm节点无扩产计划,短缺将在2026年第一季度达峰。
观点作者:国联民生证券
观点内容:AI算力快速发展趋势下,CPU作为基础设施,其需求与供给之间的矛盾或将延续,龙头在供给侧出现短缺;英特尔因先进制程产能被AI芯片挤占,且不打算扩大关键节点产能,导致CPU短缺将持续,供需矛盾加剧。
观点作者:台积电(产业链信息)
观点内容:3nm/5nm等先进制程产能优先供给GPU芯片,CPU产能被持续挤压;全球晶圆厂扩产节奏放缓,高端CPU产能稀缺性凸显,叠加国产封装整合尚处初期,无法有效填补海外缺口,进一步放大供需失衡。
观点组2: 英伟达战略转向证实CPU升维为系统级中枢,其自研Vera CPU及Rubin架构强化CPU设计标志着算力重心从‘纯计算’向‘智能编排’迁移
观点作者:英伟达
观点内容:主动追加20亿美元认购CoreWeave股票,并在其平台部署专为‘代理式推理’设计的Vera CPU;因ARM CPU瓶颈,下一代Rubin架构将大幅提升CPU核心数,并开放NVL72机柜对x86 CPU的支持,表明CPU已成为AI工厂能效与系统协同的关键载体。
观点作者:DeepSeek
观点内容:在2026年Engram架构论文中提出将知识重构为可显式查表的参数化记忆,由CPU负责实时调度与检索,验证CPU在下一代AI系统中承担记忆管理、任务编排与动态决策中枢的战略功能。
观点作者:作者
观点内容:Blackwell架构暴露ARM CPU瓶颈后,英伟达下一代Rubin架构计划大幅提升CPU核心数与超线程能力,且NVL72开放支持Intel x86 CPU,印证x86在复杂指令处理与系统级调度中的不可替代性,算力演进方向正从‘算力堆叠’走向‘编排/调度’。
观点组3: 国产CPU迎来价值重估历史性窗口,受益于海外涨价缺货、政策强制国产化率目标及AI服务器升级三重共振
观点作者:作者
观点内容:国产CPU在涨价趋势中可获取更丰厚利润回报,国内厂商有望缩小与海外成本差距并加速导入互联网等新客户;海光信息、龙芯中科、中国长城等已实现产品落地与生态适配突破,正从‘可用’迈向‘好用’。
观点作者:龙芯中科
观点内容:3C6000服务器CPU已在通用与存储服务器场景加速商用,成功切入政务、金融、运营商等关键领域;LoongArch自主指令集生态覆盖全场景,软件兼容性与稳定性持续提升,国央企2027年国产化率目标为2026年冲刺提供明确政策驱动力。
观点作者:海光信息
观点内容:作为国内唯一x86高端CPU设计企业,海光四号CPU架构升级显著提升大模型调度性能;通过吸收合并中科曙光打造信创全产业链,深度受益x86架构在AI Agent场景中不可替代的系统协同需求,生态适配持续突破。
观点组4: CPU已取代GPU成为AI Agent时代算力系统的首要瓶颈,其调度能力直接决定端到端性能
观点作者:东吴证券
观点内容:在长上下文与高并发Agent场景中,大内存CPU是承载海量KV Cache的最优容器,系统吞吐受限的并非GPU计算能力,而是CPU的核心数并发调度问题。最新研究显示,工具处理环节在CPU上消耗的时间占端到端延迟比例最高达90.6%,印证CPU已成为‘木桶效应’下的新短板。
观点作者:英特尔
观点内容:AI Agent框架增加了嵌入外部工具的决策协调器,使其从被动文本应答转向自主问题解决;CPU上的工具处理显著影响执行延迟,占比最高达90.6%,系统优化必须兼顾CPU与GPU,而非仅聚焦GPU。在大批量处理场景下,CPU动态能耗占比达44%,凸显其关键制约地位。
观点作者:国金证券
观点内容:Agent驱动的强化学习时代,CPU可能比GPU更早成为瓶颈,算力的‘木桶效应’已经显现;目前CPU正演变为类似于存储的新短板,补足这一短板将是下阶段算力基础设施建设的重中之重,其效能直接决定AI端到端体验。