研究员|王晨
灵巧手是具身智能赛道最受关注的组件之一。围绕这双“手”是否有触觉,业内存在争议。
北京他山科技有限公司(简称“他山科技”)CEO马扬近日表示,如果没有触觉,机器人接触世界,“就和人类戴着隔热手套干活似的”,手部的准确性、稳定性以及速度就会受到影响。
他山科技成立于2017年,专注于AI触觉感知技术及应用解决方案研发。
01
满足触觉之后“耐用”更重要
“对我们而言,灵巧手的第一性原理是耐用性”。
马扬向第四波等媒体坦言,无论是人还是机器人,与真实世界的交互必须通过触觉完成,视觉和听觉只能“感知”,不能“改变”。
马扬发现,从去年开始,业内更关注触觉传感器的鲁棒性和耐久性。
马扬说,灵巧手开始干活后,会面临各种环境。相比触觉的灵敏,“手”的耐用也很重要,“就像人类的手,手部的感知敏感,但皮肤是全身最粗糙的一部分。”
“很多人误以为灵敏度越高越好,但在工业场景,优先级是耐用性 > 成本 > 灵敏度。”马扬指出,基础的灵敏度够用很重要。但超过够用,就是无用,如果在够用线以下也不行,一定要满足够用的标准,“在鲁棒性的基础上,它的成本一定是随着量级的迭代降低。”
拥有了感知能力和耐用性后,马扬认为,灵巧手的下一个进化方向是“触觉反射”。手部前端和大脑一样,有突触和神经元,大多微调在手端完成,若这部分操作全部上传到大脑,传输延迟将直接影响动作的连贯性。
他坦言,自己和团队最早想做灵巧手的时候,行业里面并没有合适的底层硬件,这也成了他山科技自研端侧AI触控芯片的起点。今年,该团队会有第二颗自研芯片面世。
02
数据从何而来?
灵巧手拥有AI芯片,具备了可被训练的基础。然而,现实的瓶颈是:训练数据从何而来?
具身智能的训练数据多来自仿真端和真实端。前者由于算法的低成本,能为具身智能提供冷启动优势。马扬举例指出,比如先模仿一个动作,在仿真端跑数据,跑出来的数据能让模型在真实端应用时达到约50%—80%成功率。
马扬更认可真实采集数据的路线。在他看来,具身智能最终要投入到真实世界的任务中,仅靠仿真数据,机器人能做到“可用”的级别,但离“好用”还有较远的距离。
马扬直言,真实端的数据越多越好,但目前的确受制于现有本体数量。行业当前的训练模态还是依靠仿真数据、无本体数据和本体数据相结合使用,整体数据量相对较小。
在谈及不同厂商采用手环等方法挖掘数据,却在实际效果方面未解决“抓不准”“抓不全”等问题时,马扬指出,机器人执行具体任务偏长线,当任务在进行的过程中,外部就会感受到时间上的滞后性。
“还得摸索什么数据以及训练方法是好的。”马扬说,他山科技采取的办法是,通过第一视角数据(Ego-centric,简称EGO)结合通用操作接口(UMI)进行采集,这是一个中间态的过渡方案,在快速积累现实世界数据的同时,也具备了向具身智能本体迁移的可能。
马扬表示,他山科技的训练数据按需求可以分为两类,有明确问题要解决的是一类,另一类则是没有具体的问题。相比之下,后者目标不明确,给数据采集增加了变量。
从应用方向看,马扬认为,工业机器人和消费机器人在数据需求上有不小的差异。工业端的目标明确、数据明确,把原来人或机器进行操作的数据迁移至具身的数据即可。对于消费端而言,更多的应用案例还需要机器人具备足够的泛化性,“这还得有一段发展距离。”
编辑|邱慧