潘健成:NAND Flash缺货问题十年内难解,纯云端AI已死,混合云才是终极解药
* 来源 : * 作者 : admin * 发表时间 : 2026-04-11
2026年4月,存储行业迎来关键转折点。中国台湾半导体厂家群联电子董事长潘健成发出严厉预警:AI引发的存储短缺恐将持续至2030年。英伟达新一代GPU单款产品即可能“吞掉”全球20%的闪存产能,导致今年第四季度出现“有钱买不到货”的极端行情。纯云端模式因成本高昂难以为继,未来AI落地将依赖“混合云”架构。面对危机,群联已筹集超400亿元资金紧急备货。
随着AI产业从“训练”走向“推理”与“实际应用”,行业竞争的核心已从单纯的“算力竞赛”转变为“成本与效率竞赛”。群联电子董事长潘健成在近期指出,AI真正落地的关键,既不是纯云端,也不是纯地端,而是混合云(Hybrid Cloud)架构。
潘健成对存储市场的供需状况发出了极为严峻的预警。他认为,这波NAND Flash(闪存)的缺货潮在未来十年内恐难以完全解决,甚至可能出现“有钱也买不到货”的窘境。
英伟达成“产能黑洞”
潘健成以英伟达即将推出的新一代GPU Vera Rubin为例,揭示了问题的严重性。根据测算,每一颗Vera Rubin GPU大约需要配置20多TB的SSD。如果其出货量达到1000万颗,仅这一款产品就将消耗200 EB的存储容量。
这是什么概念?2025年全球NAND Flash的总产出也不过1000到1100 EB。这意味着,仅英伟达这一款机型,就可能直接“吃掉”全球两成的闪存产能。这还未计入机器运转后产生的海量数据存储需求。
第四季度危机预警
为了因应包括英伟达新GPU及苹果新机推出,潘健成预测,今年第4季将出现NAND Flash可能有钱也买不到货的窘境。届时,AI、云端、PC及手机需求将集中爆发,缺货情况将“非常严重”。
面对供需失衡,原厂态度极其强硬。潘健成透露,已有原厂要求客户“预付3年货款”,且必须是现金。这种“卖方市场”的绝对话语权,让下游厂商面临巨大的资金与货源压力。
潘健成分析,当前市场多数AI应用仍停留在云端运算。即便部分号称“地端AI”,实际上核心运算依然在云端,装置仅作为入口,属于“假地端”。这种模式在商业上难以长期维持。
他特别引用了中国大陆市场曾出现的“养龙虾”现象作为警示:用户大量导入AI算力,初期热情高涨,但随后因云端账单过高而快速退出。这充分暴露了纯云端模式在成本控制上的巨大瓶颈。
三层算力分工:LM Router成破局关键
为了解决成本痛点,潘健成提出了未来AI发展的“三层算力分工”架构:
地端(Edge):负责实时响应与轻量级运算。
企业私有云(Private Cloud): 负责内部AI资源的调度与管理。公有云(Public Cloud): 仅处理高强度、大规模的复杂运算。
这一架构的核心在于“LM Router(大模型路由器)”。通过智能分流机制,系统能自动判断任务应在地端处理还是送往云端,从而在优化成本的同时保证效能。潘健成以群联自身的运作举例,公司AI服务器负载高度集中在白天,夜间闲置。若仅靠扩充云端资源,将导致严重的资本浪费;而通过地端分流,不仅能降低延迟,更能显著改善成本结构。
在硬件层面,为了配合混合云架构,潘健成提出了“低内存+架构优化”的创新方案。
传统观念认为,运行AI需要96GB甚至128GB的大容量内存(DRAM)。但群联的方案主打通过架构优化,让8GB或16GB DRAM即可流畅运行AI应用。这不仅降低了对昂贵高容量内存的依赖,更大幅降低了终端设备(如笔记本电脑)的门槛。
目前,群联已与多家PC品牌合作导入该方案。随着应用成熟,混合云将成为AI PC与企业AI基础架构的标准配置,这也是实现AI普及化的关键路径。
面对严峻形势,群联打破了“不借钱”的惯例,启动联贷案并发行海外可转换公司债,筹集高达420亿元新台币(以下同)资金,全力加码备货。目前公司账面库存已超500亿元。
随着HBM(高带宽内存)及NAND Flash价格同步飙涨,潘健成对产业链的健康度表示担忧。他指出,目前存储原厂毛利率飙升至80%以上,部分内存产品由1美元成本涨至终端90美元,这种暴利结构对产业发展并不健康。
他呼吁维持价格稳定,让原厂、系统商及消费者皆能获益,而非让价格一路飙涨最终扼杀整个产业生态。毕竟,只有应用端跑通了商业模式,对存储的需求才能持续,产业才能走向良性循环。
英伟达“吞噬”产能:今年Q4恐“有钱买不到货”
潘健成对存储市场的供需状况发出了极为严峻的预警。他认为,这波NAND Flash(闪存)的缺货潮在未来十年内恐难以完全解决,甚至可能出现“有钱也买不到货”的窘境。
英伟达成“产能黑洞”
潘健成以英伟达即将推出的新一代GPU Vera Rubin为例,揭示了问题的严重性。根据测算,每一颗Vera Rubin GPU大约需要配置20多TB的SSD。如果其出货量达到1000万颗,仅这一款产品就将消耗200 EB的存储容量。
这是什么概念?2025年全球NAND Flash的总产出也不过1000到1100 EB。这意味着,仅英伟达这一款机型,就可能直接“吃掉”全球两成的闪存产能。这还未计入机器运转后产生的海量数据存储需求。
第四季度危机预警
为了因应包括英伟达新GPU及苹果新机推出,潘健成预测,今年第4季将出现NAND Flash可能有钱也买不到货的窘境。届时,AI、云端、PC及手机需求将集中爆发,缺货情况将“非常严重”。
面对供需失衡,原厂态度极其强硬。潘健成透露,已有原厂要求客户“预付3年货款”,且必须是现金。这种“卖方市场”的绝对话语权,让下游厂商面临巨大的资金与货源压力。
纯云端AI模式已死?“养龙虾”悲剧恐重演
他特别引用了中国大陆市场曾出现的“养龙虾”现象作为警示:用户大量导入AI算力,初期热情高涨,但随后因云端账单过高而快速退出。这充分暴露了纯云端模式在成本控制上的巨大瓶颈。
三层算力分工:LM Router成破局关键
为了解决成本痛点,潘健成提出了未来AI发展的“三层算力分工”架构:
地端(Edge):负责实时响应与轻量级运算。
企业私有云(Private Cloud): 负责内部AI资源的调度与管理。公有云(Public Cloud): 仅处理高强度、大规模的复杂运算。
这一架构的核心在于“LM Router(大模型路由器)”。通过智能分流机制,系统能自动判断任务应在地端处理还是送往云端,从而在优化成本的同时保证效能。潘健成以群联自身的运作举例,公司AI服务器负载高度集中在白天,夜间闲置。若仅靠扩充云端资源,将导致严重的资本浪费;而通过地端分流,不仅能降低延迟,更能显著改善成本结构。
硬件革命:8GB内存也能跑AI?
传统观念认为,运行AI需要96GB甚至128GB的大容量内存(DRAM)。但群联的方案主打通过架构优化,让8GB或16GB DRAM即可流畅运行AI应用。这不仅降低了对昂贵高容量内存的依赖,更大幅降低了终端设备(如笔记本电脑)的门槛。
目前,群联已与多家PC品牌合作导入该方案。随着应用成熟,混合云将成为AI PC与企业AI基础架构的标准配置,这也是实现AI普及化的关键路径。
紧急备货:群联筹集420亿元“囤粮”
潘健成指出,AI数据产生的速度是以百倍速度推进,但存储原厂新建厂房最多仅能增加50%的产能。为了应对可能的断供风险,群联正与客户协商,要求针对第4季的需求预付货款,共同分担高昂的库存资金压力。
暴利预警:存储价格飙升恐扼杀产业
他呼吁维持价格稳定,让原厂、系统商及消费者皆能获益,而非让价格一路飙涨最终扼杀整个产业生态。毕竟,只有应用端跑通了商业模式,对存储的需求才能持续,产业才能走向良性循环。
下一条: 闪迪(SanDisk)的“千美元”豪赌






关闭返回