"自我进化"(Self-Improving)是 Hermes Agent 最核心的差异化能力,其本质是一套从执行轨迹中自动提炼并持续优化技能的学习闭环。这套系统由三个核心子系统构成:
当 Hermes Agent 完成任务时,系统会检测本次执行是否具备"可复用价值"——触发条件包括:任务执行中调用了 5 次以上工具、出现了错误并自行修复、用户进行了纠正反馈等。一旦触发,Agent 会将本次任务的执行轨迹(Trajectory)进行提炼,生成一份标准化的 SKILL.md 文件,存放于本地的 ~/.hermes/skills/ 目录下。
这份技能文件用自然语言描述"遇到某类任务时应该如何执行",包括步骤流程、工具调用顺序、常见坑点和修复方法。下次遇到同类任务时,Agent 会主动加载对应的 Skill 文件,直接按照已验证的流程执行,无需重新探索。
技能生成后并非一成不变。Hermes Agent 内置了一套离线批量进化算法(基于 DSPy 框架和 GEPA 核心算法),会定期对已有技能进行复盘和优化。如果后续执行中发现了更优路径或新的边界情况,系统会自动更新对应的 Skill 文件,使其越来越精准。这种机制让技能质量随着使用时间的推移持续提升,形成真正的"越用越聪明"。
Nudge Engine 是系统的"反思触发器"。它会在任务完成后定时提醒 Agent 回顾近期执行记录,判断是否有值得沉淀的经验尚未形成技能,或者已有技能是否需要更新。这种主动反思机制确保系统不会遗漏任何有价值的经验。
实际效果举例:
如果你让 Hermes Agent 写一个部署脚本,中间遇到了某个依赖版本的兼容性问题并成功解决,任务完成后系统会自动将"这个问题的现象、排查步骤、最终解决方案"写成一份技能文件。下次再执行类似部署任务时,Agent 会直接绕过这个坑,Token 消耗也可能从原来的 12 次工具调用降至 6 次。
相较之下,其他 Agent 框架(包括 OpenClaw)的技能系统是静态的——技能需要用户手动创建或通过特定指令触发,不会自主从执行经验中生长。这正是 Hermes Agent 敢于宣称"self-improving"的根本原因。