英伟达预告全新Rubin CPX芯片:引领人工智能推理新纪元
* 来源 : * 作者 : admin * 发表时间 : 2025-09-10
英伟达公司今天预告了即将推出的一款芯片Rubin CPX,该芯片将以8 exaflops的性能为人工智能设备提供动力。
人工智能推理涉及两个主要步骤。首先,人工智能模型分析它将绘制的信息来回答用户的提示。分析完成后,算法会一次生成一个令牌的提示响应。今天,这两项任务通常使用相同的硬件完成。
英伟达计划对其未来的人工智能系统采取不同的方法。它计划将每个步骤分配给不同的芯片,而不是使用相同的显卡执行推理工作流程的两个步骤。该公司将这种方法称为分解推理。
即将推出的Rubin CPX芯片针对两步推理工作流程的初始所谓上下文阶段进行了优化。英伟达将使用它为名为Vera Rubin NVL144 CPX的机架级系统提供动力。每个设备都将结合144个Rubin CPX芯片和144个Rubin GPU,这些处理器针对推理工作流程的两个阶段进行了优化。这些加速器将由36个中央处理器提供支持。
该公司表示,即将推出的系统将提供8 exaflops的计算能力。1 exaflop对应于每秒计算5亿次的操作。这是目前英伟达销售的高端GB300 NVL72设备性能的七倍多。
在引擎盖下,Rubin CPX基于单片芯片设计,具有128 GB的集成GDDR7内存。英伟达还包含了优化的组件,以运行大型语言模型的注意力机制。
大型语言模型(LLM)的注意力机制使其能够识别正在处理的文本片段中最重要的部分并确定其优先级。据英伟达称,Rubin CPX执行任务的速度是当前一代芯片的三倍。“我们在注意力处理方面增加了两倍,”英伟达超大规模和高性能计算副总裁伊恩·巴克(Ian Buck)说。
这位高管详细说明,视频处理工作负载也将获得速度提升。Rubin CPX包括对视频编码和解码的硬件级支持。这是在通过网络传输剪辑之前对其进行压缩以节省带宽,然后恢复原始文件的过程。
据英伟达称,Rubin CPX将使人工智能模型能够处理价值100万个代币的数据的提示。这相当于数万行代码或一小时的视频。在许多情况下,增加人工智能模型在生成提示响应时可以考虑的数据量可以提高其输出质量。
英伟达计划于2026年底开始发货Rubin CPX。这一创新不仅提升了人工智能模型的处理速度,还显著提高了效率,使得大规模数据处理变得更加可行和高效。
随着人工智能技术的不断发展,对更高性能计算的需求也在不断增长。英伟达通过推出Rubin CPX,进一步巩固了其在AI领域的领先地位。这款芯片的推出不仅代表了技术上的重大进步,也为未来的AI应用提供了更多的可能性。
例如,在自然语言处理领域,Rubin CPX能够更快地理解和生成复杂文本,从而提升聊天机器人、翻译工具和内容生成系统的性能。在视频处理方面,它可以更高效地进行视频编码和解码,使得高清视频流更加流畅,同时减少带宽占用。
此外,Rubin CPX还将助力自动驾驶汽车的发展,帮助车辆更快、更准确地处理来自传感器的数据,从而做出更安全的驾驶决策。在医疗领域,它可以帮助医生更快地分析医学影像,提高诊断的准确性和效率。
人工智能推理涉及两个主要步骤。首先,人工智能模型分析它将绘制的信息来回答用户的提示。分析完成后,算法会一次生成一个令牌的提示响应。今天,这两项任务通常使用相同的硬件完成。
英伟达计划对其未来的人工智能系统采取不同的方法。它计划将每个步骤分配给不同的芯片,而不是使用相同的显卡执行推理工作流程的两个步骤。该公司将这种方法称为分解推理。
即将推出的Rubin CPX芯片针对两步推理工作流程的初始所谓上下文阶段进行了优化。英伟达将使用它为名为Vera Rubin NVL144 CPX的机架级系统提供动力。每个设备都将结合144个Rubin CPX芯片和144个Rubin GPU,这些处理器针对推理工作流程的两个阶段进行了优化。这些加速器将由36个中央处理器提供支持。
该公司表示,即将推出的系统将提供8 exaflops的计算能力。1 exaflop对应于每秒计算5亿次的操作。这是目前英伟达销售的高端GB300 NVL72设备性能的七倍多。
在引擎盖下,Rubin CPX基于单片芯片设计,具有128 GB的集成GDDR7内存。英伟达还包含了优化的组件,以运行大型语言模型的注意力机制。
大型语言模型(LLM)的注意力机制使其能够识别正在处理的文本片段中最重要的部分并确定其优先级。据英伟达称,Rubin CPX执行任务的速度是当前一代芯片的三倍。“我们在注意力处理方面增加了两倍,”英伟达超大规模和高性能计算副总裁伊恩·巴克(Ian Buck)说。
这位高管详细说明,视频处理工作负载也将获得速度提升。Rubin CPX包括对视频编码和解码的硬件级支持。这是在通过网络传输剪辑之前对其进行压缩以节省带宽,然后恢复原始文件的过程。
据英伟达称,Rubin CPX将使人工智能模型能够处理价值100万个代币的数据的提示。这相当于数万行代码或一小时的视频。在许多情况下,增加人工智能模型在生成提示响应时可以考虑的数据量可以提高其输出质量。
英伟达计划于2026年底开始发货Rubin CPX。这一创新不仅提升了人工智能模型的处理速度,还显著提高了效率,使得大规模数据处理变得更加可行和高效。
随着人工智能技术的不断发展,对更高性能计算的需求也在不断增长。英伟达通过推出Rubin CPX,进一步巩固了其在AI领域的领先地位。这款芯片的推出不仅代表了技术上的重大进步,也为未来的AI应用提供了更多的可能性。
例如,在自然语言处理领域,Rubin CPX能够更快地理解和生成复杂文本,从而提升聊天机器人、翻译工具和内容生成系统的性能。在视频处理方面,它可以更高效地进行视频编码和解码,使得高清视频流更加流畅,同时减少带宽占用。
此外,Rubin CPX还将助力自动驾驶汽车的发展,帮助车辆更快、更准确地处理来自传感器的数据,从而做出更安全的驾驶决策。在医疗领域,它可以帮助医生更快地分析医学影像,提高诊断的准确性和效率。
上一条: 全球半导体产业迎来AI热潮,英伟达贡献显著
下一条: 潘健成:明年高频宽存储器HBM将面临缺货