1天vs7天：后训练正在重写具身智能落地速度

文章来源：企鹅号 - 机器人大讲堂

在ICRA 2026的REAL-I挑战赛现场，来自新加坡国立大学的NUS-CLEAR队伍的选手，仅用1天就让机器人完成了金属件翻正、日化无序抓取、快递分拣三项任务。

同等工作量放在过去，资深工程师往往需要耗费5-7天反复调试。期间要处理数据格式对齐、模型压缩等一系列工程问题。

这支团队能做到的核心在于，他们依托乐聚搭建的数据后训练与实时评测系统，高效完成小样本后训练。

后训练，这个在大型语言模型领域似乎已被充分讨论的环节，正在成为下一代竞争的焦点。

01.

从通才到专才，中间隔着什么？

后训练的任务，目的是让“通才”变成“专才”，模型更匹配场景需求，落地能力更强。

听起来简单，做起来却是一连串工程难题，因为不同机器人构型、零部件布局等差异巨大，方案几乎无法复用。更麻烦的是真实物理环境变化万千，这些变量难以仿真建模，进而拉低了模型执行成功率。

这正是当前具身智能行业“Demo很美好，落地很骨感”的症结所在。

一个通用操作模型，一旦被放到真实的汽车料箱拆垛产线上，初始表现往往只有30%出头。

但通过后训练，成功率却可以提升到95%以上，这种大幅的跨越，靠的就是一套完整、高效、可复用的后训练工程体系。

02.

超快部署如何实现？

乐聚后训练如何实现？一组数据非常直观：代码库在8 GPU下吞吐达到261 samples/s，相较现有开源VLA代码库提升1.5至2.8倍。这直接降低了开发者的算力成本和时间成本。

而这背后是一套标准化工具链，从而使原本3到5天的数据预处理工时压缩到1天以内；一体化部署平台让开发者无需编写适配代码；模型量化压缩工具则解决了机器人端侧算力有限的制约，实现快速上线。

乐聚与蚂蚁灵波的联合benchmark进一步量化了这套体系的工程效能。以KUAVO 4 Pro为本体，在95个真实操作场景中对5个主流VLA模型进行横向评测。结果LingBot-VLA平均过程得分36.22%，较π0.5高出9.87%。

更重要的是，夸父是四款参与评测的机器人平台中唯一跑通模型闭环的双足人形本体。这验证了后训练工具链对动态平衡控制难度更高的双足平台同样有效。

03.

后训练正在成为产业分水岭

一个行业共识在于，未来三年，具身智能领域的竞争将从“模型能力竞赛”转向“落地效率竞赛”。

这个判断基于两个事实。

第一，预训练VLA模型的能力正在快速收敛。无论是开源的π、GR00T还是LingBot-VLA，在大规模基准测试上的差距已缩小到个位数百分比。单纯堆数据、堆算力带来的边际收益在递减。

第二，例如汽车产线拆垛、3C电子料盘取放等真正产生商业价值的场景，对模型的成功率、稳定性和适应性的要求极为苛刻，一个经过充分后训练的“专才”模型，能更好完成任务。

通过为所有主流模型提供一套标准化的后训练工具链和本体平台，乐聚能使开发真正做到了一站式。这对于追赶产业落地窗口期的团队而言无疑至关重要。

04.

从工具链到生态：OpenLET的战略布局

乐聚并非在孤军作战，其发起的OpenLET开源社区目前已吸引超过70家产业链头部企业加入。超过3万条多模态轨迹与100小时真机操作数据，以及围绕这些数据不断沉淀的工具链正在持续形成数据飞轮。

乐聚与蚂蚁灵波的合作是社区内部协同的典型案例，前者提供全球少有的全尺寸双足人形真机平台和后训练工具链，后者贡献经过大规模真实数据训练的VLA基座模型。

此次benchmark不仅验证了技术可行性，更重要的是建立了一套可量化、可对比、可复现的评估体系，让更多开发者也能参与其中。

05.

结语与未来

随着落地需求不断提升，具身智能行业的竞争正在发生转向，从预训练模型的参数竞赛，走向后训练工程体系的落地效率比拼。

乐聚提供了一条降低开发门槛的可操作路径，使缺乏经验的团队也能快速参与真实任务部署。一周内完成账号获取与模型适配，一天内实现现场跑通。对行业而言，这比单项技术突破更具落地现实意义。

相关快讯