美元换人民币  当前汇率7.1

英伟达Feynman GPU将整合Groq LPU,堆叠设计挑战散热与生态兼容

* 来源 : * 作者 : admin * 发表时间 : 2025-12-30
据外媒爆料,英伟达正为其2028年推出的下一代Feynman架构GPU规划一项颠覆性设计:通过台积电SoIC混合键合技术,将Groq的LPU(语言处理单元)以3D堆叠方式集成至GPU芯片中,形似AMD X3D处理器的结构,但堆叠对象并非缓存,而是专为AI推理优化的SRAM密集型计算单元。此举旨在解决大模型推理中的“内存墙”问题,利用LPU的“确定性执行”特性,在低批次场景下大幅提升浮点运算利用率(MFU),实现毫秒级响应。
该设计充分利用台积电A16(1.6纳米)制程的背面供电技术,将主芯片用于Tensor Core与控制逻辑,上层堆叠LPU芯片专注高速缓存与数据流调度。如此既规避了在昂贵先进制程上大面积部署SRAM的成本难题,又通过垂直互连实现超低延迟通信。然而,挑战同样巨大:一是散热——在高密度GPU上叠加芯片,热密度急剧升高,需革命性散热方案;二是CUDA生态兼容性——LPU强调静态调度,而CUDA依赖硬件抽象,两者协同需底层软件重构。若英伟达能攻克这两大难关,Feynman或将成为AI推理芯片的里程碑,助其从“训练霸主”迈向“全栈AI领导者”。