英伟达Feynman GPU将整合Groq LPU，堆叠设计挑战散热与生态兼容

* 来源 : * 作者 : admin * 发表时间 : 2025-12-30

据外媒爆料，英伟达正为其2028年推出的下一代Feynman架构GPU规划一项颠覆性设计：通过台积电SoIC混合键合技术，将Groq的LPU（语言处理单元）以3D堆叠方式集成至GPU芯片中，形似AMD X3D处理器的结构，但堆叠对象并非缓存，而是专为AI推理优化的SRAM密集型计算单元。此举旨在解决大模型推理中的“内存墙”问题，利用LPU的“确定性执行”特性，在低批次场景下大幅提升浮点运算利用率（MFU），实现毫秒级响应。
该设计充分利用台积电A16（1.6纳米）制程的背面供电技术，将主芯片用于Tensor Core与控制逻辑，上层堆叠LPU芯片专注高速缓存与数据流调度。如此既规避了在昂贵先进制程上大面积部署SRAM的成本难题，又通过垂直互连实现超低延迟通信。然而，挑战同样巨大：一是散热——在高密度GPU上叠加芯片，热密度急剧升高，需革命性散热方案；二是CUDA生态兼容性——LPU强调静态调度，而CUDA依赖硬件抽象，两者协同需底层软件重构。若英伟达能攻克这两大难关，Feynman或将成为AI推理芯片的里程碑，助其从“训练霸主”迈向“全栈AI领导者”。

上一条: ASML CEO称中国光刻机技术至少落后八代下一条: AMD首款芯片逆向工程Intel 8080 成本0.5美元售700美元

快讯：

英伟达Feynman GPU将整合Groq LPU，堆叠设计挑战散热与生态兼容

业内新闻

行情日评

品牌资讯