2026年3月16日,英伟达在GTC 2026大会上正式发布了新一代Vera CPU以及全新的Vera Rubin平台。
该平台将新型CPU、GPU、网络和存储硬件集成于机架级设计,专为代理式AI(agentic AI)、强化学习和推理工作负载提供优化支持。英伟达将Vera定位为其首款专为上述工作负载定制的CPU,而Vera Rubin平台则通过七款芯片及多种机架类型,旨在构建模块化的AI工厂解决方案。
Vera CPU采用基于88个定制Olympus核心的架构,每核心支持同步多线程(Simultaneous Multi-Threading),可同时处理两个任务。该芯片配备LPDDR5X内存,提供高达1.2 TB/s的内存带宽。
英伟达表示,与传统机架级CPU相比,Vera性能提升达50%,能效提高一倍。当通过NVLink-C2C与Rubin GPU协同工作时,可实现1.8 TB/s的相干带宽,远超PCIe Gen 6标准。
此外,英伟达推出基于Vera CPU的机架系统,集成256个液冷CPU。根据官方数据,单机架可在满载性能下支持超过22,500个并发CPU环境,适用于编排调度、代理式推理、强化学习、数据处理、存储管理和高性能计算(HPC)等场景。基于Vera的服务器还将集成ConnectX SuperNIC和BlueField-4 DPU,支持单路和双路配置,未来将由合作伙伴陆续推出。
Vera Rubin平台则进一步扩展,包括Rubin NVL72 GPU机架、BlueField-4 STX存储机架、Spectrum-6 SPX以太网机架以及新型LPX推理机架。
其中,NVL72设计整合72个Rubin GPU与36个Vera CPU,能够以Blackwell平台四分之一的GPU数量训练混合专家(Mixture-of-Experts)模型,同时实现每瓦特推理吞吐量提升高达10倍、每token成本降低至十分之一。为应对功耗限制,英伟达同步推出DSX Max-Q和DSX Flex软件,旨在优化AI工厂的功率分配,扩展在受限环境下的部署能力。
英伟达确认Vera CPU已进入量产阶段,合作伙伴系统预计自2026年下半年起陆续上市。
总的来看,此次Vera CPU及Vera Rubin平台的发布,标志着英伟达在AI基础设施领域的战略迈入全新阶段。通过将专为AI定制的CPU与高性能GPU、高速互联技术及精细化的功耗管理软件深度整合,英伟达正从单一的硬件供应商向全栈式AI工厂解决方案提供商转型。
Vera平台不仅显著提升了代理式AI与强化学习等新兴工作负载的处理效率,更在能效与部署成本上实现了关键突破,为未来超大规模AI模型的训练与推理奠定了坚实的算力基础。随着合作伙伴系统于下半年陆续上市,2026年有望成为AI计算架构向更专业化、系统化演进的重要分水岭。
小编将在第一时间分享更多相关最新动态和爆料,敬请关注。