首页
学习
活动
专区
圈层
工具
发布

宇树开源 UnifoLM-VLA-0,空间感知与理解能力比肩Gemini-Robotics-ER 1.5

1月29日,宇树宣布开源 UnifoLM-VLA-0。UnifoLM-VLA-O是UnifoLM系列下面向通用人形机器人操作的视觉-语言-动作(VLA)大模型。该模型旨在突破传统VLM在物理交互中的局限,通过在机器人操作数据上的继续预训练,实现了从通用”图文理解”向具备物理常识的”具身大脑”的进化。

模型在空间感知与理解能力上较 Qwen2.5-VL-7B有显著提升,并且在“nothinking”模式下可比肩Gemini-Robotics-ER 1.5。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/Oo56kSHdPEOFfzFutBgRsTfA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券