美元换人民币  当前汇率7.1

高通推出HBC近存计算架构:AI 加速器堆叠至DRAM下方,单位功耗带宽可达HBM方案的6倍

* 来源 : * 作者 : admin * 发表时间 : 2026-06-28
一、内存墙成为 AI 推理核心阻碍

生成式 AI 算力规模持续快速扩张,但内存带宽的提升节奏难以匹配算力增长速度,行业普遍遭遇 “内存墙” 难题。大语言模型逐 Token 生成过程会产生海量内存读写需求,即便算力硬件性能充足,带宽短板也会造成硬件资源闲置,拉高整体运行功耗与长期使用成本。

现阶段 HBM 高带宽内存是 AI 加速芯片的主流配套方案。不过 HBM 依赖硅中间层完成封装,工艺复杂、研发与制造成本居高不下,同时芯片功耗与散热压力逐年走高,行业亟待寻找替代性技术路线。高通在本年度投资者日上对外公布全新 HBC 高带宽计算架构,跳出 HBM 技术路径,计划把 AI 计算单元通过 3D 堆叠工艺放置在 LPDDR 内存下方,重构加速器与存储器的连接模式。


二、HBC 架构工作原理与核心优势

HBC 架构的核心设计,是将独立的近内存 AI 加速器从主芯片 SoC 中拆分出来,垂直堆叠在 LPDDR 内存阵列之下,依靠 TSV 硅通孔技术完成芯片之间的高速互联。TSV 属于 3D 封装核心工艺,能够垂直穿透硅晶圆搭建导电通路,在极小空间内实现高速信号传输,大幅缩短数据传输距离。


这套设计带来四项核心技术优势:


传输延迟压缩至 SRAM 级别。计算单元与内存物理距离大幅缩短,数据往返时延可以比肩片上高速缓存;存储密度大幅提升。保留堆叠内存大容量特性,单位功耗下的存储容量达到片上 SRAM 的 200 倍以上;规避 HBM 封装短板。不再需要昂贵的硅中间层,简化封装流程,有效控制硬件成本,降低整机发热与功耗;依托成熟供应链。选用量产成熟的 LPDDR 内存体系,沿用现有制程与供货渠道,有效降低新技术量产落地风险。


高通把 HBC 架构建立在四项技术底座之上:3D 芯片整合能力、系统级整体设计、LPDDR 内存技术积累,以及长期优化低功耗芯片的工程经验。


三、官方性能指标与产品迭代路线


根据高通公开测试数据,HBC 架构多项能效指标显著优于现有方案:单位功耗带宽能够达到传统 HBM 产品的 5 至 7 倍;单位功耗存储容量为片上 SRAM 的 200 倍以上。第一代 HBC Gen1 搭配 AI250 加速器,单张加速卡有效带宽达到 133 TB/s,相比前代 AI200 搭配 LPDDR5X 的方案,带宽提升 18 倍。迭代版本 HBC Gen2 搭载 AI300 加速器,有效带宽较 AI200 提升 54 倍,单位功耗带宽最高可达到 HBM 的 7 倍。


产品量产节奏已经明确:

HBC Gen1+AI250 计划在 2027 年年中送出工程样品,启动客户测试;

HBC Gen2+AI300 预计在 2028 年正式推出,进一步拓展硬件扩展能力。

该架构属于高通 “蜻蜓” 数据中心算力平台的重要组成部分,整套平台整合 CPU、AI 加速器与近内存存储方案,面向大模型与智能体推理业务,目标持续降低单次算力运行成本。


四、技术思路早已存在,高通率先落地量产时间表


近内存计算并非全新技术构想,多家存储厂商与芯片设计企业都在开展同类技术研发,只是多数方案长期停留在实验室原型阶段,难以走向商业化量产。

ASIC 厂商智邦集成电路推出 DRAM-on-Logic 堆叠方案,可以在逻辑晶圆上堆叠 1 至 4 层 DRAM,带宽水平优于部分 HBM3E 产品;闪迪也在探索 NAND 闪存与计算芯片一体化堆叠方案,用来缓解高端 HBM 供给紧张问题。三星推出新一代 UFS 5.0 闪存,带宽相比前代实现翻倍。整个产业链都在尝试突破内存带宽瓶颈。

高通的差异化竞争力,在于不只发布技术原型,还给出清晰可落地的产品迭代计划。2027 年样品测试、2028 年推出第二代产品,把近存计算从技术概念推进到可商用的硬件产品阶段。与此同时,JEDEC 组织已经落地 SPHBM4 新标准,用低成本封装替代 HBM 昂贵的中间层结构,保住 HBM4 的带宽性能。两条技术路线并行推进,反映出全行业都在集中力量攻克内存墙难题。


五、HBC 架构的长处与现存约束


技术优势

绕开 HBM 高封装成本、高功耗两大痛点;依托成熟 LPDDR 产业链,压低量产不确定性;依靠 3D 堆叠拉近计算与存储距离,从架构层面破解带宽瓶颈,不再单纯依赖制程微缩提升性能。


待解决的现实约束

峰值绝对带宽与总容量不及高端 HBM 产品。高通仅披露能效优势,未公布极限带宽数值。在超大规模模型训练场景下,HBM 短期内依旧是主流选择;配套软件生态尚未成型,缺少第三方开发工具链,框架适配需要较长周期;量产节奏偏慢,第一代样品要等到 2027 年年中,大规模商业化大概率要顺延至 2028 年之后;堆叠结构带来散热难题,计算芯片夹在内存与基板中间,热管理将成为关键工程考验;当前主流 AI 软件栈均围绕 HBM 硬件开发,HBC 还需要持续验证软硬件兼容性。

六、对 AI 算力产业链的中长期影响


HBC 架构落地,印证行业产业重心发生转移:AI 算力的主要矛盾,已经从芯片算力不足,逐步转变为内存带宽跟不上算力增长。在 GPU 与 AI 加速器性能成倍迭代的背景下,存储带宽增长速度显著滞后,内存墙限制了硬件算力释放。高通选择从芯片架构入手,依靠 3D 堆叠重构存算位置关系,而不是单纯依靠先进制程提升性能。

如果 HBC 能够按照时间表完成交付,并且兑现公开的能效指标,将会给 AI 推理市场提供一条区别于 HBM 的备选技术路线,也会间接改变存储行业的竞争格局。当前高端 HBM 市场集中度较高,而 HBC 以 LPDDR 为存储载体,有望拉动通用 DRAM 需求。近期海外存储大厂已调整产能结构,优先投产 DDR5 通用内存,HBM 高溢价阶段已经显现结构性变化。