GPU霸权终结者？深度解析英伟达“神秘芯片”中国厂商有机会“弯道超车”？

文章来源：企鹅号 - 飙叔科技洞察

近期“龙虾”（OpenClaw）效应席卷全球，尤其在中国似乎一夜之间“龙虾”就渗透到了各行各业之中。业内预言，OpenClaw的爆火，可以说是第一个名副其实的爆款AI应用。同时，这也意味着AI大模型从训练阶段全面转向规模化推理时代。

另一个标志性事件是英伟达近期宣布，计划在GTC 2026大会推出专为推理优化的LPU新品，并将在下一代Feynman（费曼）架构中深度集成LPU核心。英伟达入局LPU，这是应对AI推理时代需求爆发、抵御客户自研芯片及架构竞争、缓解地缘政治带来的市场压力，通过收购Groq技术发起战略总攻。

目前AI芯片的三大技术流派分别是：GPU（英伟达）、ASIC（谷歌TPU）、可重构数据流（Groq LPU），具体优缺点如下：

LPU（语言处理单元）并非一个严格定义的芯片类别，而更像一种为语言模型推理优化的专用架构理念。但业内人士普遍认为，LPU将成为AI 推理的标配算力单元，是继GPU之后，下一代AI基础设施的关键芯片。这也意味着，全球AI芯片的竞争焦点正从单点性能转向软硬协同的全栈能力。

当然，英伟达的策略并非用LPU替代GPU，而是通过3D堆叠等先进封装技术，将LPU核心（含大量SRAM）与GPU计算晶圆整合，打造兼顾训练通用性与推理高效能的异构芯片。同时，通过提供纯CPU服务器等更灵活的产品组合，以及用资本捆绑OpenAI等核心客户，构筑从技术到生态的全方位壁垒。

因而，可以说LPU是英伟达的一种防御措施。但对于中国AI产业而言，由于无法获得英伟达等公司的高端芯片，LPU路线反而成为中国厂商宝贵的市场机会，目前在技术路线和产业化上走出了自己的节奏。

在技术布局上，中国厂商对AI芯片的三大技术流派均有布局，并在可重构等前沿领域表现出色。

在可重构数据流（RPU）领域，清微智能是该领域的领军企业，其RPU技术与Groq的LPU同源。公司已获得国家大基金二期的投资，并与摩尔线程、昆仑芯、寒武纪一同被纳入北京AI芯片的“四大金刚”。

同时，在LPU协同布局方面，星宸科技通过增资元川微（持股比例升至6.6%），共同布局LPU架构的推理芯片，其Mountain、River系列LPU Plus产品旨在共建端边侧AI整体解决方案。

而在产业落地方面，中国厂商的LPU及相关推理芯片已走出实验室，在真实场景中落地并展现出显著的经济效益。

清微智能的可重构芯片已在全国多地部署千卡级智算中心，算力卡订单总量突破30000枚，其出货量在2025年上半年已进入国内第一梯队。新疆双河市的全疆首个基于可重构计算架构的绿色算力枢纽，已全部采用清微智能芯片。

从实际运行效果来看，搭载清微智能TX81芯片的AI训推一体服务器，单机即可支持DeepSeek-R1/V3等万亿参数大模型的部署，推理成本大降50%，能效比提升3倍。

除此之外，这些年国内AI芯片的发展很快，紧跟国际前沿，目前有多家初创公司在技术路线上均可与Groq形成对标。具体如下：

因此，英伟达推出LPU是对AI推理时代的一次关键战略布局，承认了专用架构在未来算力格局中的核心地位。全球市场正形成GPU、ASIC、可重构三大流派激烈交锋的态势。

而中国厂商凭借庞大的内需市场和政策支持，不仅在技术路线上与国际保持同步，更在产业化应用上取得了实质性突破，如国内厂商在推进低延迟、高能效，降低对HBM依赖的方向进行开发，在现有架构中增加推理专用加速核，优化SRAM调度与延迟表现，实现“LPU化”升级。

相关快讯