
当前,机器人学习正从以视觉语言动作模型(VLA)为代表的“观察→动作”反应式策略,转向世界动作模型(WAM)。WAM的核心优势在于模型需先预测未来世界状态,再解码出动作,这意味着训练信号同时来自未来视频/状态预测与动作预测,数据中的物理交互序列被更充分地利用。范式变迁对训练数据提出了新要求:不仅需要带动作标注的视频序列,更需要能覆盖真实“世界状态变化”的密集监督信号。传统依赖单一机器人本体进行遥操作的数据采集方式,在任务多样性、采集成本、跨本体数据通用性方面面临严峻挑战。
腾讯云LIVSYN灵生产品体系的核心是针对WAM数据需求提供的“人本”采集解决方案。其硬件基础包括:
软件平台LDP(Livsyn Data Platform)实现了从端侧采集、数据回放/标注/审核,到生成VLA/WAM训练数据集的端到端闭环。平台支持Diffusion Policy、ACT等主流算法,并提供策略模型一键导出与适配主流机器人的推理部署能力。
通过UMI(无本体机器交互)采集方式,数据在任务多样性与跨本体通用性上取得关键突破:
在模型训练规模化过程中,灵生科技原有架构存在数据分散形成孤岛、多机共享能力不足、存储带宽制约训练周期等痛点。采用腾讯云解决方案后:
选择腾讯云的核心因素在于其技术堆栈与AI数据工作流的深度匹配:
来源:2026腾讯云AI产业应用大会LIVSYN灵生演讲材料,内容基于AI Ascent 2026演讲摘要、NVIDIA WAM术语表及DreamZero与Fast-WAM论文。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。