智能体AI时代来临,企业需重新审视GPU之外的计算选择
微资讯
从生成式AI向智能体AI的转型,正为企业提供一个转向更灵活、更经济的计算方式的契机,多位行业分析师如是表示。
早期的AI模型主要依赖英伟达(Nvidia)和AMD提供的高价GPU来获取强大的原始算力。然而,以业务流程与工作流管理为核心的新型智能体AI工具,已经可以在更高效、更具成本优势的硬件上运行。
因此,分析师指出,仍认为所有AI应用都必须依赖GPU的IT决策者,有必要重新审视硬件选型,从成本与能力两个维度综合评估。
Next Curve首席分析师莱昂纳德·李(Leonard Lee)表示:"更好的思考方式是关注AI计算的成本,以及现在智能体AI平台服务或系统的成本。'AI计算'或'加速计算'已经明显超越了GPU作为推理加速器的单一定位。"
新的硬件选择包括CPU以及专用AI芯片——即半导体行业所称的ASIC。尽管这些芯片已存在多年,但随着智能体AI逐渐走向主流,它们正展现出真正的实用价值。
其中,CPU——计算机的核心芯片——正经历某种意义上的复兴。李表示:"CPU正重新确立自己作为AI时代不可或缺的基础地位。它现在承担着整个AI技术栈的编排层和关键控制面的角色。"
Tirias Research首席分析师吉姆·麦格雷戈(Jim McGregor)指出,CPU既节能,又适合边缘端AI应用,但在具体任务场景下,专用低功耗芯片的能力更为突出。他说:"在大多数情况下,使用ASIC仍比CPU更高效,而且在平台全生命周期内通常成本更低。"
FeibusTech首席分析师迈克·费布斯(Mike Feibus)表示,推理需求的增长为经过优化的AI加速器提供了用武之地,这类加速器处理推理任务的效率高于GPU。他补充道:"CPU的相对重要性正在上升。"
英伟达已意识到自身需要一款低功耗芯片来补充其高耗能GPU产品线,并已在其硬件体系中推出了用于推理的ASIC产品。此外,英伟达近期还以200亿美元授权引入了Groq的AI芯片技术。
由于智能体AI采用的计算模式与在GPU上进行生成式AI训练存在本质差异,企业需要认真考量云服务提供商所提供的硬件选项与定价模型。J. Gold Associates首席分析师杰克·戈尔德(Jack Gold)表示:"现在更多是关于模型管理,而非模型构建——而CPU在提供工作流管理方面至关重要。"
定价差异依然是一个待解难题。戈尔德指出,纯CPU计算与高强度GPU使用的计费方式不同,导致成本难以准确预估。他说:"GPU在训练场景中由于接近100%的利用率,通常耗电量更大;而在通用计算中,服务器和CPU的利用率大约在40%至60%之间。但这高度取决于智能体正在执行的具体任务。"
戈尔德预测,未来两到三年内,80%至85%的AI工作负载将转向推理,尤其是随着工具越来越向智能体化演进。(推理意味着从更适合训练的GPU转向对简单AI任务更高效的CPU。)
他表示:"CPU在使一切正常运转方面发挥着举足轻重的作用。这正是为什么所有超大规模云服务商现在不仅在大量采购GPU,也在大量采购CPU。"
谷歌、亚马逊和微软等主要云服务提供商,例如,均已推出自研CPU和用于推理的低功耗ASIC芯片。
NeuReality业务发展与战略合作副总裁高拉夫·沙阿(Gaurav Shah)表示,当前看似CPU需求复苏的现象,实际上指向一个更深层的问题:AI基础设施的复杂性正在急剧上升。
沙阿指出,围绕数据移动、编排与网络通信的开销正在急剧膨胀。"真正推动需求的,不是CPU承担了更多AI任务,而是整个系统在努力跟上AI发展的步伐。"
除企业用户外,生成式AI公司、AI原生企业以及新兴云服务商都需要重新审视其架构设计。沙阿表示:"最终胜出的架构,将是能以最低功耗实现最高推理效率的架构,而不是在单台服务器上堆砌最多核心的架构。"
Q&A
Q1:为什么智能体AI不再需要依赖GPU?
A:智能体AI的核心在于业务流程与工作流管理,其计算模式与生成式AI的GPU训练本质不同。推理任务更适合CPU或专用ASIC芯片来完成,这类硬件成本更低、能效更高。GPU更擅长大规模并行训练,而智能体AI日常运行所需的推理计算,并不需要GPU那样的原始算力。
Q2:CPU在智能体AI中扮演什么角色?
A:CPU在智能体AI时代正重新成为核心基础设施。它承担整个AI技术栈的编排层和控制面功能,负责工作流管理和任务协调。分析师预测,未来两到三年内80%至85%的AI工作负载将转向推理,CPU的重要性将显著提升。这也是谷歌、亚马逊、微软等超大规模云服务商同时大量采购CPU和GPU的原因。
Q3:ASIC芯片相比GPU和CPU有什么优势?
A:ASIC是专用集成电路,专为特定任务设计,在推理场景中比GPU更高效,在能耗表现上也优于通用CPU。分析师指出,在平台全生命周期内,ASIC的总体成本通常低于CPU方案。英伟达已推出用于推理的ASIC产品,谷歌、亚马逊、微软等云厂商也均已部署自研低功耗ASIC芯片。