打破周期迷思:HBM需求锁定指数增长,涨价逻辑不可逆
* 来源 : * 作者 : admin * 发表时间 : 2026-05-04
随着内存价格持续飙升,外界普遍担忧HBM(高HBM的需求逻辑已与传统存储器产业规律脱钩,受AI推理架构的物理逻辑锁定,正进入指数增长轨道,涨价带宽内存)会重蹈传统DRAM的覆辙,在需求高峰后陷入周期性反转。但半导体架构分析人士表示,趋势不可逆转。
在CPU主导运算的年代,DDR内存始终处于辅助角色,工业界的经验法则是,即便DDR带宽直接翻倍,CPU整体效能的提升也不超过两成。这种架构决定了传统DRAM的成长节奏缓慢,DDR3到DDR5历时15年,过去十年PC的DDR容量仅增长三倍,周期性起伏成为传统存储器的宿命,厂商的主要获利来源仅为容量提升。
但AI推理时代的到来,彻底改写了存储器的价值标准。当前AI时代的核心KPI,是每单位成本与每单位功耗能产生多少个Token,英伟达CEO黄仁勋提出的“AI工厂”概念,正是这一逻辑的生动体现——以最低成本生产最多Token,并将输出速度推向极限,而这一目标的实现,完全依赖于HBM的性能。
半导体架构分析人士将AI推理的Token吞吐量,拆解为“同时处理的请求批次数量×每个请求的平均Token生成速度”,而这两个参数的瓶颈,均指向HBM。其中,批次数量的瓶颈是HBM的存储容量,每一个推理请求的KV缓存都需实时存放在HBM中,批次规模与HBM容量呈线性正比;Token速度的瓶颈则是HBM的带宽,读取速度直接决定Token生成效率,而读取速度的上限就是HBM的带宽。
这一关系可形象比喻为机场接驳车:HBM容量是车厢大小,决定一次能载多少乘客;HBM带宽是车门宽度,决定乘客上下车速度;Token吞吐量就是两者的乘积。若要让每一代GPU的Token吞吐量维持两倍增长,HBM容量与带宽的乘积就必须每代翻倍。
针对“软件优化可降低HBM依赖”的观点,分析人士表示,软件效率与硬件规格的进步是两个独立维度,无法互相取代。就像CPU软件优化再彻底,英特尔、AMD每一代产品仍需提升跑分才能立足,GPU的逻辑同样如此——只要全球对Token的需求持续扩张,对HBM容量和带宽的需求就不会停止。更关键的是,这种需求并非来自外部景气拉动,而是供应端的内生需求,英伟达要推出下一代GPU,就必须向三星、SK海力士、美光施压,推动HBM性能升级,因为HBM的天花板就是GPU效能的天花板。
分析人士强调,HBM已告别传统存储器的周期宿命,其需求被AI推理架构锁定在指数增长轨道,与AI市场冷热、整体经济景气循环无直接因果关系。当前的核心问题不在需求端,而在供应端——三大HBM厂商能否克制盲目扩产冲动,避免埋下供过于求的隐患,这将是本轮存储器周期能否长期延续的关键。
在CPU主导运算的年代,DDR内存始终处于辅助角色,工业界的经验法则是,即便DDR带宽直接翻倍,CPU整体效能的提升也不超过两成。这种架构决定了传统DRAM的成长节奏缓慢,DDR3到DDR5历时15年,过去十年PC的DDR容量仅增长三倍,周期性起伏成为传统存储器的宿命,厂商的主要获利来源仅为容量提升。
但AI推理时代的到来,彻底改写了存储器的价值标准。当前AI时代的核心KPI,是每单位成本与每单位功耗能产生多少个Token,英伟达CEO黄仁勋提出的“AI工厂”概念,正是这一逻辑的生动体现——以最低成本生产最多Token,并将输出速度推向极限,而这一目标的实现,完全依赖于HBM的性能。
半导体架构分析人士将AI推理的Token吞吐量,拆解为“同时处理的请求批次数量×每个请求的平均Token生成速度”,而这两个参数的瓶颈,均指向HBM。其中,批次数量的瓶颈是HBM的存储容量,每一个推理请求的KV缓存都需实时存放在HBM中,批次规模与HBM容量呈线性正比;Token速度的瓶颈则是HBM的带宽,读取速度直接决定Token生成效率,而读取速度的上限就是HBM的带宽。
这一关系可形象比喻为机场接驳车:HBM容量是车厢大小,决定一次能载多少乘客;HBM带宽是车门宽度,决定乘客上下车速度;Token吞吐量就是两者的乘积。若要让每一代GPU的Token吞吐量维持两倍增长,HBM容量与带宽的乘积就必须每代翻倍。
针对“软件优化可降低HBM依赖”的观点,分析人士表示,软件效率与硬件规格的进步是两个独立维度,无法互相取代。就像CPU软件优化再彻底,英特尔、AMD每一代产品仍需提升跑分才能立足,GPU的逻辑同样如此——只要全球对Token的需求持续扩张,对HBM容量和带宽的需求就不会停止。更关键的是,这种需求并非来自外部景气拉动,而是供应端的内生需求,英伟达要推出下一代GPU,就必须向三星、SK海力士、美光施压,推动HBM性能升级,因为HBM的天花板就是GPU效能的天花板。
分析人士强调,HBM已告别传统存储器的周期宿命,其需求被AI推理架构锁定在指数增长轨道,与AI市场冷热、整体经济景气循环无直接因果关系。当前的核心问题不在需求端,而在供应端——三大HBM厂商能否克制盲目扩产冲动,避免埋下供过于求的隐患,这将是本轮存储器周期能否长期延续的关键。






关闭返回