首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >给 OpenClaw 装了一套“学习系统”:Self-Improving + AutoSkill,Agent 开始自己进化了

给 OpenClaw 装了一套“学习系统”:Self-Improving + AutoSkill,Agent 开始自己进化了

作者头像
技术人生黄勇
发布2026-03-16 11:21:10
发布2026-03-16 11:21:10
1.9K0
举报
文章被收录于专栏:技术人生黄勇技术人生黄勇

我发现了一件有意思的事情:如果给一个 OpenClaw 加上“学习能力”,它就不再只是一个工具,而更像是一个会成长的系统

很多人养小龙虾的方式,其实还是典型的聊天对话的 Chat 模式:问一个问题,得到一个答案,然后结束这一轮交互。

Agent 在这个过程中并不会真正“记住”什么,每一次对话几乎都是从零开始。

但如果一个 Agent 能够记录自己的错误,复盘每天的交互,从中总结经验,并把这些经验沉淀为可复用的能力,那么它就具有了学习能力。

最近我在 OpenClaw 里体验到的两个Skill技能,正好赋予了 Agent 这种能力:self-improving-agent,和 AutoSkill

简单来说,前者让 Agent 自己学会成长,而后者让 Agent 的技能库也能够持续进化。

如果把 Agent 看成一个数字员工,这两个技能相当于给员工建立了一套完整的复盘和方法论沉淀机制


给小龙虾装上“学习的大脑”

Self-Improving Agent 是一个很有意思的技能。安装完成之后,系统会自动创建一套简单但实用的学习结构。

首先,它会在系统中生成一个 .learnings 目录,并在里面建立三份文档,用来记录在日常交互中的经验。

第一份是 ERRORS.md,专门用来记录各种失败和异常,例如命令执行失败、工具调用出错或者推理出现偏差。

第二份是 LEARNINGS.md,用来沉淀新的经验和最佳实践,比如用户纠正的信息、更加高效的解决方案,或者某个工具更好的使用方式。

第三份则是 FEATURE_REQUESTS.md,专门收集用户提出的改进建议。

很多工程团队都会维护类似的这套结构的文档:错误记录、经验总结以及需求列表。

只不过这一次,写这些文档的不再是工程师,Agent 开始像工程师一样写复盘文档了。

更有意思的是,这套系统并不是被动记录,而是带有自动触发机制

只要出现一些典型场景,例如命令执行失败、用户纠正回答,或者发现更优的解决方案,系统就会提醒记录相关经验。

随着时间推移,这些记录会逐渐形成一套属于这个 Agent 的知识沉淀。


每天自动复盘

另外,为了最后增加一个兜底的机制,我让 OpenClaw 设置了一个定时任务:每天凌晨 4 点自动进行一次自我反思。

放在凌晨 4 点考虑这个时间是资源最空闲的时候。

在这个过程中,脚本会检查当天的对话记录,并尝试从这些交互中提取有价值的经验。

例如哪些问题曾经失败、哪些解决方案更有效、是否出现了新的工具使用方式。随后这些经验会被整理并更新到核心记忆库 MEMORY.md 中,同时记录新的版本历史。

整个过程有点像一个工程团队的“日终复盘”。区别只是,这一次复盘的对象不再是人,而是一个 Agent。

很多技术团队都强调复盘文化,因为经验如果不沉淀,很快就会被遗忘。而现在,AI 也开始做同样的事情了。

某种意义上,这已经非常接近一个真实团队中的知识管理系统。

用一句话总结这个能力:让 AI 具备持续学习的能力。

ClawHub 地址:https://clawhub.ai/pskoett/self-improving-agent


技能也开始进化:AutoSkill

如果说 Self-Improving Agent 解决的是“Agent 自己如何学习”,那么 AutoSkill 解决的是另一个的问题:

技能如何持续迭代进化。

AutoSkill 是一个来自华东师范大学和上海人工智能实验室的开源项目。它的核心思想很直接:

不是人为设计所有技能,而是让系统从真实交互中自动提炼技能

换句话说,技能不再只是 Prompt,而是从经验中长出来的能力。

AutoSkill 框架由两个紧密耦合的流程组成。

右环,即技能进化,通过提取和维护将交互体验转化为显式技能。

左环,即技能增强响应生成,利用当前的技能库,通过查询重写、技能检索和上下文注入来支持响应生成。

这样,系统通过记忆增长而非模型微调来持续改进。

在之前的系统中,技能往往是人工设计的静态或者是动态拼接的提示词 Prompt。

AutoSkill 尝试做另一件事情——观察用户和大模型的交互,然后从这些经验中抽象出可复用能力

当用户和 Agent 进行长期交互时,系统会分析这些对话和行为轨迹,从中寻找稳定的模式。

例如某些固定的写作要求、工作流程或者表达风格。当这些模式反复出现时,系统就会把它们抽象为一个可复用的技能。

这种技能会被保存为一种标准化文档形式,通常叫做 SKILL.md。技能里面不仅包含描述,还会记录触发条件、标签以及执行提示。

相比传统 Prompt,这种结构更加透明,人类也可以直接查看和编辑。

更重要的是,技能并不是一次性创建的

AutoSkill 为技能设计了版本管理机制,就像软件版本升级。

当用户在后续对话中提出新的约束或反馈时,系统不会创建新的技能,而是把新的经验合并到原有技能中,并自动升级版本号。

这样一来,技能会随着时间不断被优化,而不是越来越碎片化。


AutoSkill 的工作方式

从整体流程来看,AutoSkill 的工作逻辑其实可以用三个步骤来概括: 摄取经验、提炼技能、复用能力。

首先,系统会摄取用户交互过程中的各种信号,例如对话内容、行为轨迹以及用户反馈。

这些数据本身并不直接成为技能,而只是原始学习材料。

随后系统会分析这些材料,判断其中是否存在可复用模式。

如果只是一次性的请求,例如“写一篇报告”,系统通常不会生成技能。

但如果用户反复强调某些稳定约束,比如要求保持专业语气、避免幻觉、严格保留原意,那么这些规则就会被提炼为一个技能。

最后,系统会对这些技能进行维护和管理。新的能力会被加入技能库,已有技能则可能被更新或合并,而不具备复用价值的模式则会被过滤掉。

随着时间推移,一个越来越成熟的技能库就会逐渐形成。


技能不是设计出来的,而是“长出来的”

论文中有两个非常有意思的案例。

其中一个技能被命名为“顶级心理咨询师”。这个技能并不是人工编写的,而是系统从用户对话中总结出来的一种行为模式。

它要求 Agent 在回应心理问题时保持温暖、共情和专业的语气,同时避免给出医疗诊断或药物建议。

另一个案例是一个文本重写技能,名字叫 professional_text_rewrite

这个技能的目标是让 Agent 在重写文本时提高流畅度和专业度,但必须严格保留原意,并且不添加额外解释。

这个技能在系统中已经迭代到了 0.1.34 版本,说明它通过用户反馈被持续优化了三十多次。

这些案例说明了一件事情:

技能并不是设计出来的,而是从经验中长出来的。

AutoSkill 开源项目地址:

https://github.com/ECNU-ICALK/AutoSkill

AutoSkill 论文:

https://arxiv.org/abs/2603.01145

安装提示词:

代码语言:javascript
复制
安装这个技能:https://github.com/ECNU-ICALK/AutoSkill

AI Agent 的发展方向

从 Self-Improving Agent 和 AutoSkill 的设计中,其实可以看到 AI Agent 的一个重要趋势:未来的核心不只是模型能力,而是进化能力。

一个真正成熟的 Agent 至少需要具备三种能力。

首先是记忆能力,它能够记住用户的习惯和偏好。

其次是复盘能力,它可以从错误和失败中不断学习。

最后是技能沉淀能力,把一次次经验转化为稳定的解决方案。

当这三件事情结合在一起时,Agent 就会逐渐变成一种新的形态:

个人数字替身

它会慢慢理解你的写作风格,记住你的工作方式,逐渐优化你的工作流程。

时间越久,这个 Agent 就越像你自己。


最后

过去我们使用 Agent,本质上是在使用一种工具。

Self-Improving Agent 让 Agent 学会复盘自己,而 AutoSkill 则让技能能够不断进化。

当这两种能力结合在一起时,AI 不再只是回答问题,而是开始持续积累经验、沉淀方法,并逐渐形成自己的能力体系。

某种意义上,这可能就是未来 Agent 的形态:

随着时间不断迭代的智能助手


如果你的 OpenClaw 能够持续学习、复盘并沉淀技能,你最希望它先学会哪一件事?

欢迎评论区留言。

<完>

推荐阅读:

让 OpenClaw 替你打工(三):我不止给它装了 30+ Skills 还创建了技能

腾讯版"小龙虾"免费用!WorkBuddy 公测上线|QClaw 也在内测中

让OpenClaw替你打工:每日摘要、获取社交网站信息、量化模拟回测(实战教程&踩坑)

让你的OpenClaw替你打工:从0到1跑通小红书运营全流程(实战教程)

谷歌提示工程白皮书|Google Prompt Engineering White-paper

AI 会替代程序员吗?Anthropic 内部使用 Claude Code 的使用调查

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 技术人生黄勇 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 给小龙虾装上“学习的大脑”
  • 每天自动复盘
  • 技能也开始进化:AutoSkill
  • AutoSkill 的工作方式
  • 技能不是设计出来的,而是“长出来的”
  • AI Agent 的发展方向
  • 最后
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档