从芯片到全栈计算,黄仁勋称英伟达已不是芯片公司
* 来源 : * 作者 : admin * 发表时间 : 2022-03-25
英伟达GTC 2022大会在北京时间3月22日晚举行,英伟达CEO黄仁勋在主题演讲中探索讨论AI、Omniverse等前沿科技,并发布了一系列新品包括基于Hopper架构的新GPU和Grace 超级CPU。
“拼接”芯片,NVLink连接技术有和特别之处?
去年GTC大会上预告过的Grace CPU终于露出水面。这次的Grace有两个版本,第一个版本叫做Grace-Hopper,是"CPU+GPU结合体,使用NVLink技术连接,带宽高达900GB/s。
而Grace CPU超级芯片则由两个CPU芯片封装组成,它们之间通过NVLink-C2C连接。整个超级芯片总计144个CPU内核(基于ARMv9指令集),缓存容量396MB,支持LPDDR5X ECC内存,带宽高达1TB/s。
值得注意的是,能够让Grace CPU完成“拼接”的技术是内存一致性芯片之间的NVLink互连、低延迟的芯片到芯片互连技术NVLink-C2C。
新的芯片互联技术不难让人联想到传统的PCIe及新的UCIe标准。UCIe即通用小芯片高速互连,目的是通过开源设计实现芯片之间的芯片互连标准化,从而降低成本,促进更广泛的验证芯片的生态系统。UCIe 标准旨在与其他连接标准(如 USB、PCIe 和 NVMe)一样普遍。目前该标准已经得到英特尔、AMD、Arm、台积电和三星等巨头的支持。
“这些芯片标准都非常好,”黄仁勋说道,“UCIe标准类似PCIe标准,从芯片层面看,UCIe能耗更低、速度更快,并且它像PCIe一样,可以让每个芯片独立工作,英伟达仍然可以结合自身的技术。而图形方面仍旧是PCIe标准的天下。”
黄仁勋进一步指出,UCIe在某些情况下依然不具备一些能力,它仍然是一个外围接口并不能直接接入芯片。但NVLink技术可以直接连接两块芯片,它的优势是强大的性能以及一致性。“当两块芯片连接在一起时就如同成为了完整的一体,几乎就像直接连接至大脑一样,这使得它非常复杂。”
据了解,NVLink-C2C 可提供高达 25 倍的能效,比英伟达目前使用的 PCIe 5.0 PHY 的面积效率高 90 倍,支持高达 900 GB/s 或更高的吞吐量。该接口支持 CXL 和 Arm 的 AMBA CHI 等行业标准协议,并支持从基于 PCB 的互连到硅中介层和晶圆级实现的各种连接。
“更加复杂的集成度建立在我们所做的许多事情需要更高的性能,对于我们创建的应用程序也需要更高的带宽。从这一点看,NVLink所提供的芯片互联技术的强大性能是PCIe及UCIe做不到的。”黄仁勋表示,因此英伟达的合作伙伴和客户必须了解NVLink,利用好芯片内所有资源就如同它们就在使用单一芯片一样。
在发布新的NVLink技术同时,英伟达同时宣布允许其他供应商将该设计用于他们自己的小芯片,并且还将支持新的UCIe标准。
黄仁勋对此指出,NVLink技术是必须的,但英伟达也将尽可能多地使用PCIe及UCIe标准,将其直接连接至芯片,以利用好内存及所有处理器单元。
“我对于UCIe标准有着极大的期望与想象,但目前UCIe还需要尽快迭代、进化,让人们了解它到底是什么。”
AI使技术民主化
人工智能是英伟达永恒的命题,无论是CPU、GPU还是DPU,一切为了计算,高性能计算而生。Grace CPU超级芯片被黄仁勋称作“AI工厂的理想CPU”。
如今英伟达已经能够提供全栈AI,除了AI计算硬件外,其AI软件也有不少进展。
在本届GTC大会上,英伟达发布了60多个针对CUDA-X的一系列库、工具和技术的更新,以加速量子计算和6G研究、网络安全、基因组学、药物研发等领域的研究进展。
黄仁勋直言AI已经从根本上改变了软件的能力以及开发软件的方式,过去十年,英伟达加速计算在AI领域实现了百万倍的加速。
“在上一次计算机革命中,西方从计算机科学的进步中获得了巨大的利益,很多发达国家比发展中国家受益更多,许多人知道如何编写计算机程序来开发最先进的软件”黄仁勋指出,而现在有更多人知道如何应用人工智能,因为AI是一种自我编写的程序,它编写的软件比世界上任何计算机科学家都好。
他认为人工智能会缩小科技的差距,使技术民主化。“印度的初创企业数量飙升,大部分都依赖于人工智能,其根本的原因在于这项技术基本是开源的。因此,无论是英伟达设计芯片,还是与其他芯片连接,我们都将保持开放,并为此创建蓝图,这样就可以共同推动行业的发展。”
以“全栈式、多样性”应对供应中断
今年年初,英伟达生产的GPU报价较零售价高出数千美元,与其他外包生产的芯片制造商一样,英伟达一直难以确保足够的供应来满足需求。
大多数企业对今年芯片供应形势仍保持谨慎的态度,甚至表态直到年中也不会有任何改善。
黄仁勋在谈到供应链问题时指出,全球供应链仍是动荡的,最先进的处理器总是稀缺。因此英伟达也采取一些措施来帮助公司度过特殊时期,打造有别于其他芯片公司的独特性。
黄仁勋表示,一些公司始终使用先进工艺技术来实现差异化,但英伟达不这么做。首先,英伟达提供高性能的方式是通过所谓的“全栈”式。例如,英伟达设计的新架构芯片,通过芯片互联技术连接在一起;创造了CoWoS 2.5D封装技术的首批用户同时也是全球使用规模最大的用户。不光在硬件上追求不同层面的创新,英伟达也在整个软件堆栈上进行创新,提出新的算法和引擎等。
其次,英伟达依赖于多样性,支持不同的工艺节点。黄仁勋指出,英伟达的产品基于各种制程节点包括16nm、12nm、8nm等,直到现在推出的最先进的4nm工艺节点,每一款产品都在目标市场中名列前茅。
“显然,图形计算不必仅仅依赖于5nm或3nm,我们依赖的是全栈创新。英伟达不仅仅是一家芯片公司,而是一家全栈计算公司,因此我们可以在所有IT领域进行创新,创造价值。”
黄仁勋强调,在过去几年里,基于以上两点策略,英伟达极大地扩展了供应链。英伟达与台积电和三星有着良好的合作关系,同时如基板、封装等供应链也得到了扩展,而节点的多样性给公司带来更多的弹性。






关闭返回