首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >阿里开源新模型 RynnBrain:具身智能迎来“时空记忆”时代

阿里开源新模型 RynnBrain:具身智能迎来“时空记忆”时代

作者头像
Henry Zhang
发布2026-03-04 13:22:41
发布2026-03-04 13:22:41
1910
举报

题图摄于北京德胜门箭楼

由于微信公众号更改规则,请点击上面“亨利笔记”关注本号,再点击右上角”...",选择“设为星标”,以免错过文章更新。

近日,阿里巴巴达摩院正式发布并开源了具身智能大脑基础模型 RynnBrain。一次性开源7个全系列模型,包括那个参数规模达到 30B 的 MoE(混合专家)架构版本。

这意味着什么?机器人第一次拥有了“长期记忆”和对物理世界的深度理解能力。(可看到与我们之前文章讲到的大模型记忆能力如出一辙,都是往记忆的方向使劲 )

从“木头人”到“思考者”

我们不妨把传统机器人想象成一个只会背剧本的演员。

你给它写好了台词(预设程序),告诉它什么时候出场、什么时候退场。可一旦剧本外的意外发生,比如中途有人打断,或者道具位置变了,它就彻底卡壳,站在原地不知所措。

为什么会这样?因为它们缺乏两个核心能力:记住过去的能力和理解空间的能力。

RynnBrain 恰恰在这两点上实现了质的突破。

先说记忆能力。达摩院团队给 RynnBrain 装了一个叫“时空记忆”的核心模块。这个模块可不是简单的存储空间,而是一个结构化的“世界记忆库”。

想象一下:你让机器人把水杯放在厨房台面上,然后让它去打扫客厅。几个小时后,你突然想起那杯水,让机器人帮忙取回来。传统机器人早把这事忘到九霄云外了。但搭载RynnBrain的机器人会毫不犹豫地返回厨房,准确找到那个杯子。

因为它在自己的“记忆库”里,把“杯子”和“厨房台面”这两个信息牢牢绑在了一起,还记录了精确的空间坐标。这不是简单的缓存,而是可查询的结构化知识图谱。

再说空间理解能力。你有没有见过那种机械臂抓取物体的视频?经常是对着一个矿泉水瓶戳半天都抓不起来,看着都着急。这就是典型的“空间理解幻觉”:模型虽然知道“那个瓶子在那里”,但它算不出“我的手该以什么角度、什么力度伸过去”。

RynnBrain 解决这个问题的方式很有意思,叫“文本与空间定位交错推理”。

啥意思?当它分析“把左边的红苹果递给老人”这个指令时,它的思考过程不再是纯文本的,而是边走边说、边说边指:“首先走向【桌子】(对应视频帧中的区域坐标),然后伸出手对准【苹果】(对应物体的边界框),避开旁边的【水杯】(对应障碍物的点集)……”

这种“边说边指”的推理方式,确保了模型的每一个决策都扎根于真实的物理环境。

“小而美”的技术突围

在国际巨头的围剿下,RynnBrain 走出了一条独特的技术路径。

目前全球具身智能领域呈现出明显的技术分化:OpenAI 侧重认知层突破,特斯拉聚焦本体运动控制,英伟达则构建底层开发生态。而 RynnBrain 打出的牌是“极致的效率”。

你可能不懂技术参数,但你一定明白这个道理:对于机器人这种对功耗、算力极其敏感的设备,模型越小,响应越快,落地可能性就越大。

RynnBrain-30B-A3B 模型有个神奇的特点:虽然总参数达到 30B,但实际推理只需要激活约 3B 的参数。3B 激活参数的性能,超越了 72B 规模的 Pelican-VL 模型——当前规模最大的具身基础模型。这种“按需调度”有效降低了 FLOPs 与显存负载,使端到端控制延迟缩短至 12ms,在低功耗下实现了具身智能的性能压制 。

这就好比别人家造了个大排量油耗惊人的越野车,你造了一台同样能翻山越岭但百公里只烧 3 个油的家用 SUV。谁更适合走进千家万户?答案不言而喻。

更惊人的是响应速度,端到端控制延迟最低可达 12 毫秒。人眨一下眼大约需要300 毫秒,12 毫秒对于工业机器人来说,几乎就是“瞬间反应”。

开源战略背后的生态愿景

如果说技术突破只是 RynnBrain 的第一步,那么全栈开源就是达摩院布下的一盘更大的棋。

这次开源,不只是把模型扔出来那么简单。达摩院还配套开放了完整的推理训练代码、专属评测基准 RynnBrain-Bench ,以及包括 22 项细粒度指标的全新评测体系。

这在行业里投下了一颗重磅炸弹。

以前各家各户搞研发,都是闭门造车。你说你的模型强,我说我的算法好,但大家用的评测标准都不一样,根本没法比。RynnBrain-Bench 的出现,相当于给行业立了一把“公平秤”。

这个评测基准有多细?包含 2000 个动态场景测试用例,涵盖物体认知、空间认知、物体定位及具身点预测四大维度,共 3616 个视频片段(近58万帧)和12000 个精心策划的开放式问题。

更关键的是开源协议的选择:Apache License 2.0。开发者可以自由使用、修改和分发代码,可以用于商业产品开发,无需支付任何授权费用。如果愿意,甚至可以在 RynnBrain 基础上做二次开发,然后闭源发布。

这种开放姿态,让 RynnBrain 迅速成为具身智能领域的“公共基础设施”。开发者不用再自己从头训练模型去理解什么叫“左边”、什么叫“障碍物”,随拿随用。

从实验室到千家万户

技术的终极价值,在于应用。

RynnBrain 的发布,正在加速具身智能从实验室 Demo 走向产业应用的进程。在家庭服务、工业制造、仓储物流、医疗护理等多个领域,搭载 RynnBrain 的机器人已经展现出惊人的能力提升。

未来的家庭服务机器人,不再是你喊一句它动一下的“木头人”。它能记住你常放东西的位置,能理解“去厨房拿个杯子倒杯水送到客厅”这种多步骤指令,能在你打盹时自动调低音量。

未来的工业机器人,不再是困在安全围栏里的“机械臂”。它能和人协同作业,能理解手势指令,能在零件缺失时主动去寻找,然后返回继续装配。

未来的教育机器人,能观察学生的学习状态,记录学习过程,提供个性化的指导和建议。

从数字世界走向物理世界,从“被动执行”到“主动理解”,机器人终于要真正“开窍”了。

欢迎关注 亨利笔记, 👍 点赞 | ⭐ 收藏 | ↗️ 转发。

近期文章:

现象级开源AI智能体:OpenClaw(Clawdbot)五层架构深度解析

这个能“动手”的开源项目,让普通人拥有“数字分身”

别再只会写提示词了!MCP+Skills这两大杀器,正在终结“AI智障”时代!

本公众号聚焦人工智能,云原生和区块链等技术原理,请立即关注亨利笔记 ( henglibiji ),以免错过更新。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-02-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 亨利笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 从“木头人”到“思考者”
  • “小而美”的技术突围
  • 开源战略背后的生态愿景
  • 从实验室到千家万户
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档