充分利用先进的计算平台，综合运用CPU、GPU、FPGA等异构平台

为客户打造高性能计算资源

NVIDIA发布新一代AI服务器：单机架算力达800亿亿次，2026年底登场

9月 11, 2025 — 来源：慧点数码

NVIDIA发布新一代AI服务器：单机架算力达800亿亿次，2026年底登场

2025年9月10日，科技巨头NVIDIA在新品发布会上带来重磅消息，除了推出专为大规模上下文处理设计的Rubin CPX，更披露了两款新一代AI服务器——“Vera Rubin NVL144”与“Vera Rubin NVL144 CPX”，在硬件配置、算力性能及存储带宽上实现跨越式升级，为人工智能训练与推理领域注入强劲动力。

作为定位于AI训练与推理的旗舰产品，基础款“Vera Rubin NVL144”单机架配置堪称豪华：搭载36颗Vera CPU与144颗Rubin GPU，搭配1.4PB/s超高带宽的HBM4内存及75TB高速存储。在算力表现上，其在NVFP4数据精度下可达3.5 EFlops（即每秒350亿亿次），较前代产品GB300 NVL72提升3.3倍，能高效支撑大规模人工智能模型的训练与复杂推理任务。

而进阶版“Vera Rubin NVL144 CPX”进一步强化性能，在保留36颗CPU、144颗GPU核心配置的基础上，额外加入72颗Rubin CPX，同时升级至1.7PB/s带宽的HBM4内存与100TB高速存储，并兼容Quantum-X800 InfiniBand或Spectrum-X以太网，搭配ConnectX-9 NIC网卡提升数据传输效率。该版本在NVFP4数据精度下的算力突破至8 EFlops（每秒800亿亿次），较GB300 NVL72提升7.5倍，成为当前GPU服务器领域的性能标杆。

若有超大规模算力需求，用户可将两台“Vera Rubin NVL144 CPX”服务器组合，实现配置与算力直接翻倍，满足更复杂的人工智能场景需求。NVIDIA方面表示，这款高性能AI服务器将为用户带来显著经济效益，每投入1亿美元，有望获得50亿美元的回报，凸显其在产业落地中的高价值潜力。

此外，NVIDIA还公布了清晰的产品路线图：Rubin GPU及相关AI服务器系统将于2026年底正式登场；2027年将推出升级版Rubin Ultra，进一步优化性能；2028年则会推出全新的Feyman GPU，继续搭配Vera CPU，以“每年一次迭代”的节奏，持续推动GPU服务器与人工智能硬件的技术革新，践行“全栈式架构、CUDA生态全覆盖”的发展战略。

此次新一代AI服务器的发布，不仅展现了NVIDIA在高端计算硬件领域的技术领导力，更将为人工智能产业的规模化发展提供关键基础设施支撑，助力企业与科研机构在大模型训练、深度学习推理等领域突破算力瓶颈，加速AI技术在各行业的落地应用。