为代理式AI而生：英伟达发布Vera Rubin平台，能效与性能大幅跃升

文章来源：企鹅号 - 宗熙先生

2026年3月16日，英伟达在GTC 2026大会上正式发布了新一代Vera CPU以及全新的Vera Rubin平台。

该平台将新型CPU、GPU、网络和存储硬件集成于机架级设计，专为代理式AI（agentic AI）、强化学习和推理工作负载提供优化支持。英伟达将Vera定位为其首款专为上述工作负载定制的CPU，而Vera Rubin平台则通过七款芯片及多种机架类型，旨在构建模块化的AI工厂解决方案。

Vera CPU采用基于88个定制Olympus核心的架构，每核心支持同步多线程（Simultaneous Multi-Threading），可同时处理两个任务。该芯片配备LPDDR5X内存，提供高达1.2 TB/s的内存带宽。

英伟达表示，与传统机架级CPU相比，Vera性能提升达50%，能效提高一倍。当通过NVLink-C2C与Rubin GPU协同工作时，可实现1.8 TB/s的相干带宽，远超PCIe Gen 6标准。

此外，英伟达推出基于Vera CPU的机架系统，集成256个液冷CPU。根据官方数据，单机架可在满载性能下支持超过22,500个并发CPU环境，适用于编排调度、代理式推理、强化学习、数据处理、存储管理和高性能计算（HPC）等场景。基于Vera的服务器还将集成ConnectX SuperNIC和BlueField-4 DPU，支持单路和双路配置，未来将由合作伙伴陆续推出。

Vera Rubin平台则进一步扩展，包括Rubin NVL72 GPU机架、BlueField-4 STX存储机架、Spectrum-6 SPX以太网机架以及新型LPX推理机架。

其中，NVL72设计整合72个Rubin GPU与36个Vera CPU，能够以Blackwell平台四分之一的GPU数量训练混合专家（Mixture-of-Experts）模型，同时实现每瓦特推理吞吐量提升高达10倍、每token成本降低至十分之一。为应对功耗限制，英伟达同步推出DSX Max-Q和DSX Flex软件，旨在优化AI工厂的功率分配，扩展在受限环境下的部署能力。

英伟达确认Vera CPU已进入量产阶段，合作伙伴系统预计自2026年下半年起陆续上市。

总的来看，此次Vera CPU及Vera Rubin平台的发布，标志着英伟达在AI基础设施领域的战略迈入全新阶段。通过将专为AI定制的CPU与高性能GPU、高速互联技术及精细化的功耗管理软件深度整合，英伟达正从单一的硬件供应商向全栈式AI工厂解决方案提供商转型。

Vera平台不仅显著提升了代理式AI与强化学习等新兴工作负载的处理效率，更在能效与部署成本上实现了关键突破，为未来超大规模AI模型的训练与推理奠定了坚实的算力基础。随着合作伙伴系统于下半年陆续上市，2026年有望成为AI计算架构向更专业化、系统化演进的重要分水岭。

小编将在第一时间分享更多相关最新动态和爆料，敬请关注。

发表于: 2026-03-172026-03-17 10:03:43
原文链接：https://page.om.qq.com/page/Ooqbj_MTRp0tFyu5yYcKdvog0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

为代理式AI而生：英伟达发布Vera Rubin平台，能效与性能大幅跃升

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐