英特尔发布高密度至强机架设计,助力智能体 AI 工作负载
英特尔在 2026 年台北国际电脑展上正式发布了全新的机架级参考设计。通过与富士康及其他基础设施供应商的合作,英特尔旨在提升智能体 AI(Agentic AI)的 CPU 计算密度。这些蓝图专为处理复杂的软件框架而设计,例如 OpenClaw——该框架能将 AI 模型与终端 Shell、代码解释器及外部 API 紧密连接。尽管目前的 AI 模型通常依赖 GPU,但英特尔首席执行官陈立武(Lip-Bu Tan)表示,这些以 CPU 为核心的设计填补了基础设施架构中的关键空白。
“客户要求我们从系统层面进行思考,以帮助他们大规模处理真实的智能体工作负载,”陈立武在主题演讲中说道。这些参考设计具有高度的可配置性,最多可支持 128 个处理器。根据芯片选择的不同,机架既可以容纳 128 核心的 Granite Rapids 至强 6 处理器,也可以搭载基于英特尔 18A 工艺打造的 288 核心 Clearwater Forest 至强 6+ 芯片。
在满载配置下,这些系统能在 100kW 的功耗范围内提供 16,384 个 P-core 或 36,864 个 E-core 的算力,并支持高达 384 TB 的 DDR5 内存。此举使英特尔直接与英伟达展开竞争,后者近期也发布了搭载 256 颗 Vera CPU 的机架级平台;同时,Arm 也推出了参考设计,涵盖了 36kW 风冷系统(8,160 核心)到 200kW 液冷机架(45,696 核心)等多种规格。
除了高密度机架设计,英特尔还在推进与 SambaNova 合作开发的“解耦推理蓝图”。该架构通过分离计算密集型的预填充(prefill)操作与带宽密集型的解码(decode)操作来优化推理性能——前者由英伟达 GPU 处理,后者则由 SambaNova 加速器负责。英特尔声称,这种分层方法能将单用户的 Token 输出效率提升两到三倍。
目前,该解耦推理平台的商业化应用已经启动,Vector Core Compute 已成为首批部署者,Together.AI 也被确认为首个商业客户。英特尔计划通过其成熟的原始设计制造商(ODM)和原始设备制造商(OEM)合作伙伴网络,将基于这些新参考蓝图的系统推向市场。