【导读】在2026英特尔至强6+新品发布会暨数据中心创新日上,英特尔联合腾讯云、金山云、阿里云、新华三、云尖信息等产业伙伴,共同探讨了Agentic AI(智能体AI)时代的数据中心演进趋势,并正式发布新一代英特尔至强6+能效核处理器(代号Clearwater Forest)。
英特尔认为,随着AI从模型训练迈向推理和智能体应用,数据中心正在经历新一轮架构重构。在这一过程中,CPU不再只是辅助角色,而是重新成为AI基础设施的调度中心和控制中枢。
中国AI市场快速增长,CPU需求迎来爆发
英特尔市场营销集团副总裁、中国区总经理郭威表示,中国已经进入AI全面普及阶段。预计到2030年,新一代智能终端和智能体应用普及率将超过90%;到2031年,全球活跃智能体数量将达到3.5亿个。与此同时,2025年,词元(Token)调用总量达到了21100万亿,而今年会更快,今年的一季度算力需求爆涨417%。
根据三方机构调研显示,Agentic AI、物理AI以及强化学习的发展,正在显著提升CPU需求。过去一年中,CPU与GPU在数据中心中的部署比例快速变化,从过去的1:8逐步提升至接近1:2,CPU的重要性正在持续增强。
郭威认为,AI的发展不仅发生在云端数据中心,也正在向企业、家庭、移动终端以及边缘侧延伸。随着AI应用无处不在,CPU、GPU、网络和存储需要形成更加紧密的协同架构,这也为整个产业链带来了新的发展机会。
Agentic AI推动CPU价值回归
英特尔公司全球副总裁兼首席市场营销官Brett Hannath表示,在过去几年中,AI产业的关注点主要集中在GPU和加速器上,但随着AI推理和Agentic AI的兴起,计算需求已经从单纯的模型训练扩展到复杂的系统协同。
如果说大模型训练是一场由GPU主导的“独奏”,那么Agentic AI则更像是一场由CPU统筹指挥的“交响乐”。在智能体应用中,数据调度、任务编排、工具调用、上下文管理以及多智能体协同,都需要CPU承担核心协调工作。
他指出,CPU始终是现代计算体系的基础。未来,无论AI技术如何演进,CPU都将继续承担系统编排者的角色,而至强处理器也将持续成为数据中心的重要支柱。
英特尔数据中心集团副总裁兼中国区总经理陈葆立表示,过去一年中,智能体AI的发展速度远超预期。与传统大模型推理相比,智能体不仅需要模型推理能力,更需要大量任务编排、工具调用、数据库访问和执行控制能力,而这些工作主要依赖CPU完成。他透露,英特尔与国内头部大模型厂商交流时发现,仅一年时间内,对方的CPU需求就增长了5倍。这一变化并非预测模型推导,而是真实客户反馈。
AI需求爆发导致CPU持续紧张
针对市场关注的供应问题,陈葆立坦言,从2025年底开始,英特尔已经观察到明显超预期的市场需求。
不过相比其他厂商,英特尔拥有自己的晶圆制造能力,这成为重要优势。目前,至强6采用Intel 3工艺,至强6+采用Intel 18A工艺,英特尔拥有完整供应链体系。尽管如此,面对Agentic AI带来的需求增长,短期内CPU供应紧张仍将持续存在。
陈葆立表示,未来需求是否会持续多年,最终仍取决于AI能否真正提升生产力。但从目前来看,整个行业仍处于非常早期的发展阶段,增长潜力远未释放完毕。
CPU需要具备四项支撑力
陈葆立表示,首先,AI智算中心基础设施正在Agentic时代面临重塑,从Agentic AI应用中的需求侧与供给侧架构出发,需求侧承载智能体应用的控制面,要求尽可能高的密度与能效,供给侧从推理的应用特点出发,加速上下文处理,优化KV Cache,最终在Token的生产上做到降本增效,所以我们说CPU在Agentic AI时代用量的上升,其实是这多种集群共同作用的结果。
能够满足上述三种集群需求的CPU应该是什么样的?陈葆立表示,英特尔总结成四种支撑力:
算力:主打通用计算负载,在通用算力的基础上,基于AMX技术的矩阵运算能力,能为机头场景中的AI数据预处理,MOE及KV Cache的卸载提供加速支持;
存力:至强处理器的演进已经为AI就绪的存储系统或方案奠定了基础,能实现基于高密度全闪存储介质的低时延、高IOPS和高读写吞吐性能表现;
连接力:依托以太网网卡产品的迭代,以及与行业标杆客户在IPU上的探索,为设备的高效连接与通信提供高效灵活的支持。
保障力:英特尔有领先于整个行业的可信计算技术来更好地保护AI应用中的数据与模型,以及RAS技术来保证智算中心基础设施的高可靠、高可用和高可维护优势。
英特尔最新发布的至强6+,就将这四种力结合在一起,是它重塑智算中心的底气所在。
四力合一的至强6+
“在特定场景下,一个CPU核心可同时运行3至4个轻量级智能体,单颗288核至强6+,可以支持超过1000个智能体运行。”陈葆立在会议上如是说。为什么至强6+如此强大?因为至强6+,在四种力上都不存在弱点。
第一,在算力方面,英特尔数据中心集团产品总监Kira Boyko正式发布了代号Clearwater Forest的至强6+处理器。
作为业界首款采用Intel 18A工艺制造的数据中心CPU,至强6+拥有多项关键创新:最高288个能效核;支持8000MT/s DDR5内存;最高576MB三级缓存;采用PowerVia背面供电技术;采用RibbonFET全环绕栅极晶体管技术;支持全新应用能源遥测(AET)技术。
在性能方面:相比上一代产品性能密度提升最高2.5倍;每线程每瓦性能提升最高45%;相比第二代至强平台可实现最高9:1服务器整合率。
“至强6+主要面向云基础设施、媒体处理、Web服务、数据库和存储等典型工作负载,并特别适合大规模Agentic AI部署场景。”Kira Boyko强调。
除了CPU产品,英特尔还首次披露新一代数据中心GPU——Crescent Island。该产品基于Xe3P架构打造,专门面向AI推理和Agentic AI场景:最高480GB LPDDR5X显存;支持运行1.6万亿参数级模型;单卡功耗控制在350W;支持标准PCIe部署;原生支持PyTorch、vLLM、SGLang等主流框架。
英特尔希望通过更高内存容量、更低TCO以及更灵活部署能力,满足下一代Agentic AI推理需求。
第二在存力方面,陈葆立指出,至强6针对存储场景进行了全面优化,包括:更强I/O能力;数据压缩加速;企业级存储方案支持。
陈葆立强调,随着长上下文和海量Token生成需求增长,存储系统成为AI基础设施的重要组成部分。
第三在连接力方面,英特尔推出全新E835以太网解决方案。其主要特点包括:支持1×200G、2×100G等多种端口配置;功耗仅12W;支持硬件级Root of Trust安全能力;支持NC-SI等管理协议;生命周期长达10年。
针对大规模AI集群,英特尔还基于Falcon协议实现开放以太网互联,在标准交换机环境下实现接近专用网络的性能表现。
第四在保障力方面,英特尔通过TDX机密计算技术,为AI应用构建硬件级可信执行环境,实现:模型参数保护;用户数据隔离;云端安全推理;应用无缝迁移。
随着AI应用深入企业核心业务,安全和隐私保护成为关键需求。TDX Connect进一步建立CPU与GPU之间的加密通信链路,实现AI训练与推理全流程安全保护。
至强6+为何适合Agentic AI?
英特尔中国区技术部总经理高宇用一个形象的比喻描述未来AI基础设施,如果把AI数据中心看作未来世界的超级工厂,那么最终产出的是Token,而支撑这个工厂运行的则是三套核心系统:GPU推理集群、CPU调度集群、高性能存储集群,而驱动这三大系统运转的核心,依然是英特尔至强处理器。
高宇特别强调,至强6+平台有两个技术,堪称是Agentic AI时代的金钥匙。
一是QAT(QuickAssist Technology)压缩引擎,主要解决闪存成本问题。在大模型推理过程中,KV Cache会不断增长。以百万Token上下文为例,单用户KV Cache规模就可能达到10GB以上。通过QAT硬件压缩技术,可以实现约50%的压缩率,10GB KV Cache压缩后可降至约5GB,大幅降低高端SSD需求,显著减少存储成本。
另外一个是IAA(In-Memory Analytics Accelerator)内存加速,主要解决内存成本问题。IAA可对内存数据进行实时硬件压缩,并在读取时实现硬件级解压。其优势包括:显著提升内存利用率;降低智能体运行所需内存容量;不增加数据加载延迟;提高服务器整体部署密度。
不过,这两项技术并非英特尔临时所加的功能,陈葆立坦言,严格来说,没有哪款CPU是在数年前专门为今天的Agentic AI设计的,因为一颗服务器处理器从立项到量产往往需要2至4年时间。但他认为,机会总是留给有准备的人。
QAT压缩引擎、IAA内存加速等技术,英特尔已经布局多年。过去由于软件生态和应用需求不足,这些能力并未被广泛采用。而随着Agentic AI带来海量KV Cache和内存需求,这些技术的价值开始迅速显现。
陈葆立表示,今天很多客户主动修改软件架构来利用这些硬件能力,因为它们能够直接帮助企业节省大量存储和内存成本。
合作伙伴怎么评价至强
腾讯云计算产品运营总监周驰认为,CPU与GPU比例提升不应简单理解为单台服务器内部的配置变化,而应从全球业务总量角度来看待。他表示,随着AI应用持续“破圈”,越来越多非技术用户开始使用智能体工具。大量原本因为投入产出比不高而无法实现的自动化业务,如今正在被AI重新激活。这些业务往往不需要大量GPU计算,而更依赖CPU完成调度、执行和高并发处理,因此推动了CPU需求快速增长。
腾讯云星星海产品架构师黎洁介绍,腾讯云基于英特尔至强平台构建了面向超大规模云计算的高密度算力架构。其最新平台支持:288 vCPU超大规格实例;200G直通网络;自研智能网卡;TDX/SGX机密计算;QAT硬件加速。
腾讯云还建立了完整的无感迁移体系,通过热迁移、故障预测和主动调度技术,实现业务连续性保障。目前,该平台已广泛应用于腾讯广告、QQ红包、腾讯会议和QQ音乐等核心业务场景。
云尖信息副总裁张欢军指出,在未来智能体基础设施中,数据入口、任务路由、工作流调度以及Token管理等工作几乎都运行在CPU集群之上。随着企业级Agent逐渐普及,CPU的重要性还将进一步提升。
张欢军现场中向EEWorld介绍,“云尖一直致力于智能硬件基础设施建设,并以开放的生态提供一站式技术服务平台。英特尔一直是我们从一开始就首选且合作非常紧密的伙伴,我们希望能跟英特尔持续合作,推动一代代产品走向更好、更成功的方向。”
金山云计算研发负责人杨峰表示,随着AI Agent架构兴起,CPU已经从过去的辅助角色转变为系统“大脑”。在金山云Agent平台中,任务编排、知识库检索、工具调用、记忆管理等关键流程均运行于CPU侧,而GPU则专注于模型推理。
金山云基于至强6+打造的SE10实例具备:核心与线程1:1绑定;三级缓存提升近5倍;单核性能提升约10%;能效提升约10%。在Agent部署场景中,可实现超过80%的部署密度提升,并显著降低响应时延。
新华三集团存储产品线首席产品经理王其勇表示,未来AI推理将成为存储需求增长的核心驱动力。以DeepSeek V4为例,在100万Token上下文条件下,单用户KV Cache容量可达9.6GB,并将随着用户数量线性增长。
为此,新华三推出AI原生存储平台X20000,具备:块、文件、对象统一存储;单节点200GB/s带宽;300万IOPS性能;KV Cache加速能力。未来还将推出面向KV Cache的专用存储系统,实现320GB/s带宽和微秒级时延。
阿里云智能集团块存储研发总监谷跃胜认为,Agent应用将推动存储需求进入新的增长周期。相比传统应用,Agent具有:生命周期更短;调度频率更高;实例规模更大;负载模式更随机。
为此,阿里云与英特尔联合优化QAT、DSA等硬件加速技术,使压缩带宽提升400%,CPU资源占用下降75%,显著提高整体存储效率。
四力之外,更重要的是“生态力”
陈葆立总结表示,算力、存力、连接力和保障力共同构成了英特尔面向Agentic AI时代的数据中心基础能力。
而在英特尔深耕中国40余年的发展过程中,与产业伙伴共同打造的生态体系,则成为最重要的第五种能力——“生态力”。
面对Token需求指数级增长和智能体应用快速普及,未来AI竞争不仅是模型竞争,更是基础设施效率竞争。英特尔将携手云服务商、设备厂商和软件生态伙伴,共同构建面向Agentic AI时代的新一代智算基础设施。


