你的位置:首页 > 新品 > 正文

效能飞跃10倍,Token成本降至十分之一:Supermicro发布NVIDIA Vera Rubin平台

发布时间:2026-03-23 责任编辑:lily

【导读】Super Micro Computer, Inc.(SMCI)正式宣布推出基于下一代NVIDIA Vera Rubin平台的全方位系统产品组合,包括革命性的Vera Rubin NVL72超级集群、高灵活性的2U HGX Rubin NVL8系统以及专为代理式AI设计的Vera CPU服务器。依托其成熟的模块化数据中心构建模块解决方案(DCBBS)架构与先进的液冷技术,Supermicro旨在通过提供每瓦吞吐量高达前代10倍、Token成本降低至十分之一的卓越效能,协助企业快速部署具备极致密度与能效的新一代计算基础设施,从而在激烈的市场竞争中确立领先优势。


Supermicro的2U HGX Rubin NVL8系统为硬件灵活性最高的计算平台,可支持NVIDIA Vera与新一代x86 CPU,并能实现每机柜72个Rubin GPU的密度。此系统也可搭配DCBBS液对气(Liquid-to-Air,L2A)Sidecar冷却液分配单元,可部署于未导入液冷技术的数据中心。


全新Supermicro NVIDIA Vera CPU系统机型包括可容纳最高6个RTX PRO 4500 Blackwell服务器版本GPU的2U服务器,以及搭载NVIDIA BlueField-4 DPU的新型AI存储系统,可支持情境内存(Context Memory)的扩充。


Super Micro Computer, Inc.(NASDAQ:SMCI)作为云端计算、AI/机器学习、存储和5G/边缘领域的全方位IT解决方案供应商,宣布推出基于NVIDIA Vera Rubin平台的系统产品组合。许多数据中心正转型为AI工厂,规模化智能计算、代理式推理、长上下文AI,以及混合专家模型(Mixture-of-Experts,MoE)等类型的工作负载,也使市场对新型计算与存储基础设施的需求持续提升。Supermicro的NVIDIA Vera Rubin NVL72、NVIDIA HGX Rubin NVL8与NVIDIA Vera CPU系统是基于其Data Center Building Block Solutions(DCBBS)架构,具有先进的液冷设计,可加速客户项目的部署与上线。


Supermicro_AI_Data_Platform_Solutions.jpg


Supermicro AI Data Platform Solutions


Supermicro总裁兼首席执行官梁见后表示:"我们正迈向全新的时代。在这个时代中,每个组织都需要AI工厂,才能在市场中脱颖而出。现今推理工作负载的计算需求,也正重新定义数据中心设施所必须提供的效能。Supermicro正对其DCBBS进行更佳的设计,以支持即将推出的NVIDIA Vera Rubin NVL72、HGX Rubin NVL8,以及Vera CPU系统,帮助客户更快速、更明确地实现新一代AI工厂的规模化部署。我们很高兴能率先推出这些解决方案,并通过先进的计算设施,推动产业迈向AI新时代。"


了解更多:NVIDIA Vera Rubin | Supermicro


基于NVIDIA Vera Rubin与Rubin平台的Supermicro DCBBS解决方案


要规模化地提供AI工厂级的效能,除了计算组件外,也需要无缝集成与运行的电力、散热与网络基础设施。Supermicro的模块化DCBBS架构,使数据中心营运商能部署经验证、预先工程化设计的机架解决方案,而无需为每个项目定制基础设施,从而加速项目启动与上线、最小化整合程序的风险,以及减少不同规模的AI工厂部署整体拥有成本(TCO)。


Supermicro DCBBS的设计可应对不断变化的散热、电力与网络需求,并能支持即将推出的NVIDIA Vera Rubin NVL72、NVIDIA HGX Rubin,以及NVIDIA Vera CPU架构,实现快速且稳固的部署。Vera Rubin平台自此代产品起,皆需通过完整的液冷配置进行散热,而DCBBS提供了全面、经验证的液冷基础设施。这些设施包括机架内(In-Rack)与机架列间式(In-Row)配置,相关核心组件包括冷却液分配单元(CDU)、歧管,以及液对气侧边式散热柜(Sidecar)。此外,冷却塔(Cooling Tower)、布线设计与部署服务等基础设施解决方案,也可与Supermicro新一代系统产品组合进行无缝集成。


Supermicro NVIDIA Vera Rubin NVL72 SuperCluster


Supermicro正将NVIDIA Vera Rubin NVL72与新型DCBBS液冷组件进行设计上的结合,以完整支持机架与集群规模的电力与散热需求。这也包括优化NVIDIA MGX机架、机架内或机架列间式CDU、背门式热交换器(RDHx),以及液对气Sidecar的制造,以优化机架式AI超级计算机的规模化生产与部署程序。Vera Rubin NVL72作为机架式加速计算单元,通过协同设计,整合了六组核心组件。这些组件为Rubin GPU、Vera CPU、NVIDIA NVLink 6、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU,以及NVIDIA Spectrum-X Ethernet,可使该计算单元提供最高3.6 Exaflops的推理效能、75TB的高速内存,以及1.6 PB/s的HBM4带宽。相较于NVIDIA Blackwell,Vera Rubin NVL72可达到最高10倍的每瓦吞吐量,并使Token成本降低至约十分之一。


NVIDIA HGX Rubin NVL8系统


新型2U HGX Rubin NVL8系统是目前密度与硬件弹性最高的HGX平台,亦是首个在CPU搭配上提供更高灵活度的HGX系统。除了NVIDIA Vera CPU,该平台也可支持新一代AMD与Intel x86处理器。此HGX平台是基于NVIDIA MGX机架架构,并集成了Supermicro的盲插式总线(Blind Mate Busbar)与歧管,能实现免工具(Tool-Free)式的机架整合。这使客户可将八个Rubin GPU与最适合其工作负载及软件架构的CPU平台进行自由搭配。


这项设计使每组机架可支持9个HGX Rubin NVL8系统,并配备最高72个Rubin GPU,适用于大规模AI训练、推理,以及加速型HPC应用。DCBBS技术则提供机架内CDU、机架列间式CDU、背门式热交换器,并可选择性搭配液对气Sidecar,以应对客户在液冷或气冷数据中心内的部署需求。


搭载RTX PRO的NVIDIA Vera CPU系统


Supermicro的Vera CPU新一代代理式AI(Agentic AI)系统,具有多功能AI计算节点的设计,可用于企业的新型代理式AI应用部署。该系统搭载双NVIDIA Vera CPU,并可于紧凑型2U机箱内可支持最高6个RTX PRO 4500 Blackwell服务器版本GPU,为企业AI推理、代理工作负载与可视化应用提供极佳的计算密度与能效,也能加速各类企业工作负载的计算。此外,这款系统可在空间有限的环境内,发挥其高带宽LPDDR5X内存子系统与PCIe GPU加速性能的优势。


NVIDIA BlueField-4 STX情境记忆存储平台


Supermicro即将推出的情境记忆存储(Context Memory Storage,CMX)平台,是专为情境记忆打造的全新AI原生存储系统。CMX平台具有智能化Pod级情境记忆存储技术,可扩充GPU的KV Cache容量,并提供了Vera Rubin NVL72超级集群所需的数据吞吐量,能支持长上下文推理的运行。该平台搭载了NVIDIA BlueField-4处理器、NVIDIA Vera CPU、NVIDIA ConnectX-9 SuperNIC、NVIDIA Spectrum-X Ethernet、NVIDIA DOCA,以及NVIDIA Dynamo,提供高带宽、低延迟的网络架构,以及智能化数据路径卸除(Data Path Offload)技术,可应对大规模AI推理与检索增强生成(RAG)工作负载的需求。


Supermicro此次发布的NVIDIA Vera Rubin系列解决方案,不仅标志着计算硬件在性能密度上的重大飞跃,更代表了数据中心基础设施向全面液冷化、模块化及智能化转型的关键一步。通过深度整合NVIDIA最新的Rubin GPU、Vera CPU、NVLink 6互联技术及BlueField-4 DPU,并结合灵活的DCBBS液冷架构(支持液对气侧边部署),Supermicro成功解决了大规模AI部署中电力、散热与网络集成的核心痛点。


3-958x200_20251021044824_513.png

特别推荐
技术文章更多>>
技术白皮书下载更多>>
热门搜索

关闭

 

关闭