近期“龙虾”(OpenClaw)效应席卷全球,尤其在中国似乎一夜之间“龙虾”就渗透到了各行各业之中。业内预言,OpenClaw的爆火,可以说是第一个名副其实的爆款AI应用。同时,这也意味着AI大模型从训练阶段全面转向规模化推理时代。
另一个标志性事件是英伟达近期宣布,计划在GTC 2026大会推出专为推理优化的LPU新品,并将在下一代Feynman(费曼)架构中深度集成LPU核心。英伟达入局LPU,这是应对AI推理时代需求爆发、抵御客户自研芯片及架构竞争、缓解地缘政治带来的市场压力,通过收购Groq技术发起战略总攻。
目前AI芯片的三大技术流派分别是:GPU(英伟达)、ASIC(谷歌TPU)、可重构数据流(Groq LPU),具体优缺点如下:
LPU(语言处理单元)并非一个严格定义的芯片类别,而更像一种为语言模型推理优化的专用架构理念。但业内人士普遍认为,LPU将成为AI 推理的标配算力单元,是继GPU之后,下一代AI基础设施的关键芯片。这也意味着,全球AI芯片的竞争焦点正从单点性能转向软硬协同的全栈能力。
当然,英伟达的策略并非用LPU替代GPU,而是通过3D堆叠等先进封装技术,将LPU核心(含大量SRAM)与GPU计算晶圆整合,打造兼顾训练通用性与推理高效能的异构芯片。同时,通过提供纯CPU服务器等更灵活的产品组合,以及用资本捆绑OpenAI等核心客户,构筑从技术到生态的全方位壁垒。
因而,可以说LPU是英伟达的一种防御措施。但对于中国AI产业而言,由于无法获得英伟达等公司的高端芯片,LPU路线反而成为中国厂商宝贵的市场机会,目前在技术路线和产业化上走出了自己的节奏。
在技术布局上,中国厂商对AI芯片的三大技术流派均有布局,并在可重构等前沿领域表现出色。
在可重构数据流(RPU)领域,清微智能是该领域的领军企业,其RPU技术与Groq的LPU同源。公司已获得国家大基金二期的投资,并与摩尔线程、昆仑芯、寒武纪一同被纳入北京AI芯片的“四大金刚”。
同时,在LPU协同布局方面,星宸科技通过增资元川微(持股比例升至6.6%),共同布局LPU架构的推理芯片,其Mountain、River系列LPU Plus产品旨在共建端边侧AI整体解决方案。
而在产业落地方面,中国厂商的LPU及相关推理芯片已走出实验室,在真实场景中落地并展现出显著的经济效益。
清微智能的可重构芯片已在全国多地部署千卡级智算中心,算力卡订单总量突破30000枚,其出货量在2025年上半年已进入国内第一梯队。新疆双河市的全疆首个基于可重构计算架构的绿色算力枢纽,已全部采用清微智能芯片。
从实际运行效果来看,搭载清微智能TX81芯片的AI训推一体服务器,单机即可支持DeepSeek-R1/V3等万亿参数大模型的部署,推理成本大降50%,能效比提升3倍。
除此之外,这些年国内AI芯片的发展很快,紧跟国际前沿,目前有多家初创公司在技术路线上均可与Groq形成对标。具体如下:
因此,英伟达推出LPU是对AI推理时代的一次关键战略布局,承认了专用架构在未来算力格局中的核心地位。全球市场正形成GPU、ASIC、可重构三大流派激烈交锋的态势。
而中国厂商凭借庞大的内需市场和政策支持,不仅在技术路线上与国际保持同步,更在产业化应用上取得了实质性突破,如国内厂商在推进低延迟、高能效,降低对HBM依赖的方向进行开发,在现有架构中增加推理专用加速核,优化SRAM调度与延迟表现,实现“LPU化”升级。