首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >马虾Agent的驾驭实践(二)

马虾Agent的驾驭实践(二)

作者头像
企业架构师思维
发布2026-05-08 10:36:17
发布2026-05-08 10:36:17
1210
举报

2026年苏超开幕式上,徐州的一首“百鸟朝凤”,让无数淮海人唤醒了开席密语“俺奶,给俺叨马虾”,马虾究竟是何方神物,先上图:

如此神物,当如何驾驭,今天就来念叨念叨,希望对大家能够领略马虾驾驭之乐。在AI领域,此处我用“马虾”代指基于HermesAgent(爱仕)和OpenClaw(龙)之类的 Agent框架构建的马虾Agent。】

2026年4月26日,在腾讯云长沙同盟和上海同盟联合举办的一场沙龙上,我分享了个人总结的一套训练马虾Agent的方法和驾驭经验,以下是基于分享内容的整理,希望对大家有所启发。

上一篇讲了马虾Agent的驾驭方法,第二篇讲讲马虾驯化的一些踩坑经历以及一些实践中总结的经验,这些经验可以让Agent的训练过程快速收敛。

1. 失忆

你在训练马虾Agent时是否也出现我相同的困惑,明明前面已经纠正过的问题,再次执行时,还是会出错。Agent会遗忘前面交代的流程,遗忘流程中的最后一个步骤,遗忘反复强调的规则。打开新对话,马虾Agent会遗忘前面交代过的内容,隔天再对话,也常常会遗忘掉上次对话纠正过的问题。

2. 角色错乱

马虾Agent总是会主动承揽其他角色的活,觉得自己是全能的,自己有做所有事情的技能,所以往往在执行完成当前活动后会不自觉地执行下一个活动,但是工作又做不到位,比如发票下载员Agent执行了发票下载后,不自觉就开始整理起发票来。另外,Agent的自我定位不清,不知道自己能做什么,不能做什么,角色职责边界不明晰。而我们在对话时也总是习惯在一次会话中让一个agent完成所有不同的任务。

3. 任务中断

有没有发现,你在指挥Agent做事情,发现它有时候会干了一半,就不干了,停止不前,你等了好久,它返回一堆它思考的内容,往往还会出现中英文混杂,最后显示context truncated。一次次的对话,Agent的响应越来越慢,直到上下文溢出。

4. 路径迷失

你有没有发现,你在训练马虾Agent时,前面验证过的执行路径,在下次执行时它不走,而是换了条新的路,不断尝试,你看在眼里急在心里,眼看着Agent在错误的道路上一路狂奔,迷失在自我探索的新路径上,你赶紧终止它,它却不听使唤,依然执迷不悔在错误的路径上探索,你恨不得把之前的对话记录甩在它的脸上,明明前面探索的路径已经走通,还在浪费时间和token试着新路径。

5. 信息过载

马虾Agent在训练执行时,往往会出现捡了芝麻丢了西瓜的情况,重要的规则没有执行,反而不要紧的提醒记在心里。打开它的记忆,事无巨细,你纠正过的问题,都记录在案,既要又要还要,分不清哪个是重点,一个memory.md 会记录同一个问题出现的不同情况,拖沓冗长。

6. 重复造轮子

马虾喜欢造轮子,动不动就重新编写一个脚本,哪怕前面解决过的问题,还是会再写一个,估计它看了自己随意写的若干的脚本,也不知道要用哪个了吧,索性重新就再写一个脚本了。

为了解决上面的问题,经过实践总结了以下经验。

实践一:明确角色分工,按角色单独训练技能

解决角色混乱、信息过载、上下文过长任务中断问题。

我们以发票整理和会计记账为例,通过定义不同角色的Agent,让这些Agent的角色职责无重合,独立完成单一业务活动,

总协调员负责整体协调,任务分配,同人类对话,识别人类意图,并按照角色分工,通过Agent2Agent协议下达指令给对应角色Agent,并跟踪和汇总结果给人类。

另外,Agent之间也会存在信息沟通的需要。以前面为例,由于角色职责限制,只有会计Agent可以查询记账系统,获得账务相关信息,所以其他的Agent要获取当前的记账月信息,则需要通过Agent2Agent实现同会计Agent的通信。

按照上述角色和职责分工,我们分别训练Agent,确保Agent有明确的职责边界,各司其职,每个Agent都清楚知道自己和别的Agent的角色和职责。明确的职责分工,需要加载的记忆和技能都减少了,这会在很大的层度减少单个Agent的上下文内容,降低信息过载的可能性,Agent的执行效率也会大大提高。

以总协调员为例,作为主Agent,只进行任务分配,不执行具体的任务。通过对话和复述,确保Agent能力清楚知道自己的职责,其他Agent的角色和边界。

实践二:对于经常犯错的问题,要总结出原则,作为驾驭护栏

规范性的工作原则需由人设置和审核。

实践三:显式给出流程指导,明确的SOP和学习样本

对确定性方案的技能蒸馏。

需要明确给出具体的执行步骤和过程以及判断标准,参考样本。可以使用-> 表示执行过程,或者if-else规则。

实践四:要求按照流程或SOP对现有状态给出评价

测试Agent对SOP理解的准确性和完整性。

实践五:重要信息显式记录、任务执行前重新读取技能

解决失忆、健忘、路径迷失的问题。

明确要求先更新进技能,再执行修复,否则可能做过后面就忘记。

实践六:持续反馈,规则更新,必要时要求重新构建脚本

需求和方案在持续迭代中不断清晰和准确,通过脚本固化业务规则,提升任务可重复性。

规则固化到脚本中解决路径迷失问题,用架构思维把解决方案转换结构化的模型,减少重复造轮子的问题。

实践七:要求进行反思、根因分析,总结原则并记录

让大模型自己分析出问题的原因,并进行记录。

好了,本篇篇幅所限,马虾Agent的踩坑经历以及一些实践中总结的经验就介绍到这里,希望这些经验可以有帮助,实现Agent的训练过程快速收敛。

了解马虾Agent的驯化方法可以看:

马虾Agent的驾驭实践(一)

后续将会讲讲Agent框架设计时要考虑到的不可能三角,现在流行的几个Agent框架基于不可能三角的对比,以及我们自己设计一个Agent框架的出发点。最后分析一下Agent未来的演进分化和行业应用趋势。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 架构师成长与关爱 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档