开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >专栏 >马虾Agent的驾驭实践（二）

马虾Agent的驾驭实践（二）

作者头像

企业架构师思维

发布于 2026-05-08 10:36:17

发布于 2026-05-08 10:36:17

1210

举报

2026年苏超开幕式上，徐州的一首“百鸟朝凤”，让无数淮海人唤醒了开席密语“俺奶，给俺叨马虾”，马虾究竟是何方神物，先上图：

如此神物，当如何驾驭，今天就来念叨念叨，希望对大家能够领略马虾驾驭之乐。在AI领域，此处我用“马虾”代指基于HermesAgent（爱马仕）和OpenClaw（龙虾）之类的 Agent框架构建的马虾Agent。】

2026年4月26日，在腾讯云长沙同盟和上海同盟联合举办的一场沙龙上，我分享了个人总结的一套训练马虾Agent的方法和驾驭经验，以下是基于分享内容的整理，希望对大家有所启发。

上一篇讲了马虾Agent的驾驭方法，第二篇讲讲马虾驯化的一些踩坑经历以及一些实践中总结的经验，这些经验可以让Agent的训练过程快速收敛。

1. 失忆

你在训练马虾Agent时是否也出现我相同的困惑，明明前面已经纠正过的问题，再次执行时，还是会出错。Agent会遗忘前面交代的流程，遗忘流程中的最后一个步骤，遗忘反复强调的规则。打开新对话，马虾Agent会遗忘前面交代过的内容，隔天再对话，也常常会遗忘掉上次对话纠正过的问题。

2. 角色错乱

马虾Agent总是会主动承揽其他角色的活，觉得自己是全能的，自己有做所有事情的技能，所以往往在执行完成当前活动后会不自觉地执行下一个活动，但是工作又做不到位，比如发票下载员Agent执行了发票下载后，不自觉就开始整理起发票来。另外，Agent的自我定位不清，不知道自己能做什么，不能做什么，角色职责边界不明晰。而我们在对话时也总是习惯在一次会话中让一个agent完成所有不同的任务。

3. 任务中断

有没有发现，你在指挥Agent做事情，发现它有时候会干了一半，就不干了，停止不前，你等了好久，它返回一堆它思考的内容，往往还会出现中英文混杂，最后显示context truncated。一次次的对话，Agent的响应越来越慢，直到上下文溢出。

4. 路径迷失

你有没有发现，你在训练马虾Agent时，前面验证过的执行路径，在下次执行时它不走，而是换了条新的路，不断尝试，你看在眼里急在心里，眼看着Agent在错误的道路上一路狂奔，迷失在自我探索的新路径上，你赶紧终止它，它却不听使唤，依然执迷不悔在错误的路径上探索，你恨不得把之前的对话记录甩在它的脸上，明明前面探索的路径已经走通，还在浪费时间和token试着新路径。

5. 信息过载

马虾Agent在训练执行时，往往会出现捡了芝麻丢了西瓜的情况，重要的规则没有执行，反而不要紧的提醒记在心里。打开它的记忆，事无巨细，你纠正过的问题，都记录在案，既要又要还要，分不清哪个是重点，一个memory.md 会记录同一个问题出现的不同情况，拖沓冗长。

6. 重复造轮子

马虾喜欢造轮子，动不动就重新编写一个脚本，哪怕前面解决过的问题，还是会再写一个，估计它看了自己随意写的若干的脚本，也不知道要用哪个了吧，索性重新就再写一个脚本了。

为了解决上面的问题，经过实践总结了以下经验。

实践一：明确角色分工，按角色单独训练技能

解决角色混乱、信息过载、上下文过长任务中断问题。

我们以发票整理和会计记账为例，通过定义不同角色的Agent，让这些Agent的角色职责无重合，独立完成单一业务活动，

总协调员负责整体协调，任务分配，同人类对话，识别人类意图，并按照角色分工，通过Agent2Agent协议下达指令给对应角色Agent，并跟踪和汇总结果给人类。

另外，Agent之间也会存在信息沟通的需要。以前面为例，由于角色职责限制，只有会计Agent可以查询记账系统，获得账务相关信息，所以其他的Agent要获取当前的记账月信息，则需要通过Agent2Agent实现同会计Agent的通信。

按照上述角色和职责分工，我们分别训练Agent，确保Agent有明确的职责边界，各司其职，每个Agent都清楚知道自己和别的Agent的角色和职责。明确的职责分工，需要加载的记忆和技能都减少了，这会在很大的层度减少单个Agent的上下文内容，降低信息过载的可能性，Agent的执行效率也会大大提高。

以总协调员为例，作为主Agent，只进行任务分配，不执行具体的任务。通过对话和复述，确保Agent能力清楚知道自己的职责，其他Agent的角色和边界。

实践二：对于经常犯错的问题，要总结出原则，作为驾驭护栏

规范性的工作原则需由人设置和审核。

实践三：显式给出流程指导，明确的SOP和学习样本

对确定性方案的技能蒸馏。

需要明确给出具体的执行步骤和过程以及判断标准，参考样本。可以使用-> 表示执行过程，或者if-else规则。

实践四：要求按照流程或SOP对现有状态给出评价

测试Agent对SOP理解的准确性和完整性。

实践五：重要信息显式记录、任务执行前重新读取技能

解决失忆、健忘、路径迷失的问题。

明确要求先更新进技能，再执行修复，否则可能做过后面就忘记。

实践六：持续反馈，规则更新，必要时要求重新构建脚本

需求和方案在持续迭代中不断清晰和准确，通过脚本固化业务规则，提升任务可重复性。

规则固化到脚本中解决路径迷失问题，用架构思维把解决方案转换结构化的模型，减少重复造轮子的问题。

实践七：要求进行反思、根因分析，总结原则并记录

让大模型自己分析出问题的原因，并进行记录。

好了，本篇篇幅所限，马虾Agent的踩坑经历以及一些实践中总结的经验就介绍到这里，希望这些经验可以有帮助，实现Agent的训练过程快速收敛。

了解马虾Agent的驯化方法可以看：

马虾Agent的驾驭实践（一）

后续将会讲讲Agent框架设计时要考虑到的不可能三角，现在流行的几个Agent框架基于不可能三角的对比，以及我们自己设计一个Agent框架的出发点。最后分析一下Agent未来的演进分化和行业应用趋势。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-05-03，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自架构师成长与关爱微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新