【导读】AI大语言模型从训练走向全面推理应用,正在全球存储器市场引发一场供需革命。随着GPT-5等超大模型的推出,AI推理对存储器的需求呈现出指数级增长态势,催生了一个可能持续多年的存储器超级周期。
AI大语言模型从训练走向全面推理应用,正在全球存储器市场引发一场供需革命。随着GPT-5等超大模型的推出,AI推理对存储器的需求呈现出指数级增长态势,催生了一个可能持续多年的存储器超级周期。
这一变革不仅推动了存储技术的快速迭代,更重塑了整个存储市场的竞争格局。据最新报告显示,仅GPT-5模型的推理需求,就可能占据全球DRAM供应量的25% 和NAND供应量的22%。
01 架构革新:AI服务器的三层存储生态
为满足大模型的苛刻需求,现代AI服务器已演化出精密的三层存储器架构,每层各司其职,协同工作。
在最顶层,HBM直接集成在GPU封装内部,扮演着“短时记忆”的角色。它负责实时高速的数据交换,专为AI的训练和推理设计。
底层则是NAND Flash,它如同大脑的档案库,负责长期存放海量数据和模型参数,主要用于模型权重加载、键值缓存溢出处理及检索式生成查询。
这种专业化分工反映了AI工作负载对存储系统的全新要求——既需要极高的带宽,又需要巨大的容量。
02 需求爆发:推理压力下的存储挑战
AI推理为存储系统带来了前所未有的双重压力。报告强调,AI推理过程中,对存储器的高带宽和大容量形成了双重挑战。
按照全球用户每秒共生成2400万个tokens计算,仅GPT-5的需求,就相当于全球DRAM供应量的四分之一,NAND供应量的近四分之一。
更令人震惊的是,若2026年tokens生成量进一步翻倍,需求占比将分别提升至43%和39%。这意味着AI推理产生的流量,足以消化全球存储器的新增产能。
受推理大模型推动,存储器需求年增长率超过100%,市场将出现明显的供需缺口。
03 市场响应:存储巨头的战略转向
面对这一历史性机遇,全球存储芯片巨头正在积极调整战略。三星、SK海力士等主要厂商正接获大量订单。
摩根士丹利预测,到2026年NAND闪存将出现高达8%的供应缺口,并将这一行业变化定义为"AI驱动的超级周期"。
这一轮周期与过去截然不同,其核心引擎是AI,需求强度堪称"吞噬级"。
一台AI服务器的DRAM容量是普通服务器的8倍,NAND容量是3倍,单台就得2TB存储才能支撑运算需求。
04 技术前沿:从HBM到创新存储方案
在技术层面,HBM因其卓越性能成为市场瞩目的焦点。现在每一块HBM芯片都需针对特定的AI GPU定制,客户需要提前一年下单。
这与传统DRAM芯片形成了鲜明对比,后者可以随时采购,甚至当天交付。
新的订货模式不仅提升了供应稳定性,也显著增强了存储厂商的议价能力。花旗分析指出,HBM的毛利率约在50%到60%,而传统的DRAM仅为30% 左右。
除了HBM,DDR5在服务器领域的渗透率也在迅速提升,预计2025年将超85%。同时,企业级SSD市场需求旺盛,订单量同比增长超35%。
05 未来展望:超级周期的可持续性
业界普遍认为,这轮存储超级周期可能比以往更具持续性。科技行业预测,这一半导体超级周期将至少持续到2027年。
与过去由智能手机和PC等消费电子拉动不同,这次的核心引擎是AI基础设施投资,其需求强度远超以往。
用于AI计算的大型数据中心、高性能计算和自动驾驶半导体将引领市场。
摩根士丹利预测,今年第四季度,动态随机存取存储器DRAM的价格将环比上涨约9%。
存储芯片行业也因此成为市场焦点,相关指数一度单日成交金额突破227亿元。
AI推理应用的大规模扩张,正在触发存储器市场数十年来最深刻的变革。随着存储芯片从标准化商品转向定制化解决方案,全球存储产业格局面临重构。
推荐阅读:
瑞芯微前三季净利预增116%-127%,RK3588芯片持续渗透多领域