充分利用先进的计算平台,综合运用CPU、GPU、FPGA等异构平台

为客户打造高性能计算资源

NVIDIA发布新一代AI服务器:单机架算力达800亿亿次,2026年底登场

9月 11, 2025 — 来源:慧点数码

NVIDIA发布新一代AI服务器:单机架算力达800亿亿次,2026年底登场
 
2025年9月10日,科技巨头NVIDIA在新品发布会上带来重磅消息,除了推出专为大规模上下文处理设计的Rubin CPX,更披露了两款新一代AI服务器——“Vera Rubin NVL144”与“Vera Rubin NVL144 CPX”,在硬件配置、算力性能及存储带宽上实现跨越式升级,为人工智能训练与推理领域注入强劲动力。
 
作为定位于AI训练与推理的旗舰产品,基础款“Vera Rubin NVL144”单机架配置堪称豪华:搭载36颗Vera CPU与144颗Rubin GPU,搭配1.4PB/s超高带宽的HBM4内存及75TB高速存储。在算力表现上,其在NVFP4数据精度下可达3.5 EFlops(即每秒350亿亿次),较前代产品GB300 NVL72提升3.3倍,能高效支撑大规模人工智能模型的训练与复杂推理任务。
 
而进阶版“Vera Rubin NVL144 CPX”进一步强化性能,在保留36颗CPU、144颗GPU核心配置的基础上,额外加入72颗Rubin CPX,同时升级至1.7PB/s带宽的HBM4内存与100TB高速存储,并兼容Quantum-X800 InfiniBand或Spectrum-X以太网,搭配ConnectX-9 NIC网卡提升数据传输效率。该版本在NVFP4数据精度下的算力突破至8 EFlops(每秒800亿亿次),较GB300 NVL72提升7.5倍,成为当前GPU服务器领域的性能标杆。
 
若有超大规模算力需求,用户可将两台“Vera Rubin NVL144 CPX”服务器组合,实现配置与算力直接翻倍,满足更复杂的人工智能场景需求。NVIDIA方面表示,这款高性能AI服务器将为用户带来显著经济效益,每投入1亿美元,有望获得50亿美元的回报,凸显其在产业落地中的高价值潜力。
 
此外,NVIDIA还公布了清晰的产品路线图:Rubin GPU及相关AI服务器系统将于2026年底正式登场;2027年将推出升级版Rubin Ultra,进一步优化性能;2028年则会推出全新的Feyman GPU,继续搭配Vera CPU,以“每年一次迭代”的节奏,持续推动GPU服务器与人工智能硬件的技术革新,践行“全栈式架构、CUDA生态全覆盖”的发展战略。
 
此次新一代AI服务器的发布,不仅展现了NVIDIA在高端计算硬件领域的技术领导力,更将为人工智能产业的规模化发展提供关键基础设施支撑,助力企业与科研机构在大模型训练、深度学习推理等领域突破算力瓶颈,加速AI技术在各行业的落地应用。
特别声明:本站登载内容出于更直观传递信息之目的。该内容版权归原作者所有,并不代表本站赞同其观点和对其真实性负责。如该内容涉及任何第三方合法权利,请及时与 chenzb@ihuidian.com 联系;我们会及时反馈并处理完毕。

上一篇:没有了
下一篇:没有了