从Generative到Agentic AI演进中,计算token需求暴增将如何重塑晶圆厂的投资时钟?
从生成式AI向Agentic AI的演进,导致Token消耗量指数级增长,这迫使晶圆厂的投资时钟从“以GPU训练为中心”转向“推理与存储并重”,并引发CPU、HBM、先进封装等环节的产能结构性紧缺与投资节奏重构。
一、核心变化:Token需求暴增如何改变算力结构
Agentic AI对Token的消耗远超生成式AI。 智能体涉及多轮推理、工具调用、代码执行和长期记忆,单次任务的Token消耗量激增。例如,AI智能体在半年内使Token消耗量增长6倍。
推理侧成为算力消耗主力。 AI的卡点正从训练转向推理。推理阶段的Token生成是实时、高频的,对算力基础设施形成持续、不可预测的压力。
二、晶圆厂投资时钟的三大重塑方向
2.1 CPU产能:从边缘配角到核心瓶颈
Agentic AI使CPU需求爆发。 智能体任务中,CPU负责调度、编排、运行代码和管理缓存,其耗时占整体运算延迟的40%-90%。GPU与CPU配比从训练阶段的8:1,向推理和Agent场景的1:1甚至倒挂演进。
供需缺口扩大。 英特尔、AMD的服务器CPU已出现涨价和交付周期拉长(最长6个月),2026年三季度或迎来新一轮涨价。全球云厂商(如字节、谷歌、亚马逊)纷纷自研服务器CPU,ARM架构渗透率预计从10%提升至44%。
晶圆厂投资倾斜。 台积电等先进制程优先供给GPU,挤压CPU晶圆产能。这意味着晶圆厂需重新评估CPU产能的投资优先级,新建CPU专用产线或调整先进制程分配。
2.2 存储芯片:进入“超级周期”,扩产节奏被迫加快
HBM与DRAM需求暴增。 Agent的长期记忆和高频检索依赖高带宽内存(HBM4、HBM4e),带宽和容量要求大幅提升。DRAM和NAND Flash合约价预计2026年Q2分别暴涨58-63%和70-75%。
存储工厂扩产周期更长,短缺持续至2027年后。 ASML财报显示,存储相关营收(32亿欧元)首次反超逻辑芯片(31亿欧元)。原厂产能爬坡需12-18个月,AI需求持续旺盛,缺口至少延续至2027年初。
“Token工厂”对存储的新要求: 数据中心从存储仓库转向Token工厂,存储软件栈需重构,以提升数据供给效率,避免GPU空转。这推动晶圆厂加快HBM、大容量NAND的产线投资。
2.3 先进封装与逻辑芯片:投资重心向“系统集成”转移
CoWoS等先进封装产能持续紧缺。 智能体算力集群要求高密度集成GPU、HBM、CPU,2.5D/3D封装产能直接决定系统性能。台积电等企业的封装产线投资回报率上升,资本开支计划已多次上修。
逻辑芯片的投资逻辑变化: 虽然训练侧GPU需求增速可能放缓,但因推理和Agent场景,通用计算(CPU)和特定推理芯片(如英伟达Vera CPU、稀疏计算芯片)的需求正在填补空缺。晶圆厂需平衡“训练专用”与“推理通用”产能的投资比例。
三、投资时钟的具体表现:从“单点爆发”到“全链通胀”
短周期(1-2年): 晶圆厂扩产主要集中于HBM、先进封装和成熟制程的CPU/DDR5接口芯片。设备、材料(如光刻胶、特种气体)采购订单前置,相关供应链业绩率先受益。
中周期(2-3年): 新晶圆厂(尤其是存储和3nm以下逻辑)建成投产,但供需缺口仍存。投资决策需考虑“Token单位成本”这一核心指标——每瓦产出Token数越高的芯片,其产线投资回报率越高。
长周期(3-5年): 晶圆厂投资逻辑从“制程微缩”转向“系统集成+新材料”。背面供电、玻璃基板、光子SOI等新材料和新工艺将在2027年后进入放量期,晶圆厂的资本开支结构将发生根本性改变。
四、风险提示
需求侧的不确定性: 若Agentic AI商业化落地不及预期,或出现更高效的算法(如MIT的ELF模型可大幅降低算力需求),Token需求增速可能回落,导致晶圆厂扩产计划超前。
供给侧的地缘与成本压力: 晶圆厂面临先进设备(如ASML EUV)交付周期长达36个月的制约,以及电力、材料成本上涨的压力,投资回报周期可能被动拉长。 (以上内容均由AI生成)