首页
学习
活动
专区
圈层
工具
发布

AI越聊越蠢——直到有人把记忆文件拆成了8层

你有没有遇到过这种情况?跟AI聊了十几轮,它突然忘了你之前说的所有话,开始胡说八道。你以为是模型不行,其实99%的情况,是你的记忆配置在拖后腿——而且还在帮你烧钱。今天拆一下OpenClaw的记忆管理,怎么用8层架构+QMD压缩,10轮对话省88% Token。

聊着聊着就失忆,是你把AI用废了

做过AI Agent配置的都知道,最头疼的不是模型选型,不是Prompt调优,而是——聊着聊着,AI突然不认识你了。

你花了一小时跟它梳理项目方案,反复强调"A项目已经砍了"。第二天一开聊,它热情地问你:"A项目的预算要不要调调?"你再强调一遍,它记住了。又过几轮,又忘了。

这不是模型的问题。OpenClaw——这个AI Agent项目——有一个机制:默认单文件上限2万字符,超了静默截断。不报错、不提醒,你最重要的指令可能已经被吃掉了,你完全不知道。

OpenClaw GitHub:33万星,60天超越React十年纪录

更厉害的是烧钱。以前每条消息5K Token,你往MEMORY.md里塞了一堆东西后膨胀到50K——费用直接翻10倍。一天100条消息,从2.25美元飙到22.5美元。一个月几百美元,换来一个越来越不靠谱的助手。

这背后其实是一个问题:99%的用户把所有东西堆在一个MEMORY.md里。偏好、项目记录、会议决策、代码片段——全在一起。就像把公司所有文件从营业执照到快递单锁在一个保险柜里,每次找东西都要翻一遍。

同样用OpenClaw,成本和体验差了一个量级

不是塞更多记忆,而是拆成8层按需加载

解决方案其实不复杂。关键认知转变就一句话:不是把所有东西让AI记住,而是让AI知道去哪找。

OpenClaw启动时只自动加载8个特定文件名:SOUL.md、AGENTS.md、USER.md、TOOLS.md、IDENTITY.md、HEARTBEAT.md、BOOTSTRAP.md和MEMORY.md。你那个叫notes.md、knowledge-base.md的笔记?AI压根看不见——这一点官方文档写了,但大部分人没注意到。

理解了这个机制,方案就清楚了——像操作系统一样分层管理:

优化后的workspace目录结构:8个标准文件 + daily日志

以前是AI每轮对话都背着一个50K Token的大书包;现在是带一本薄薄的索引目录,需要什么现查现取。所有配置文件加起来不超过10K Token,只占上下文窗口的4%,剩下96%全留给实际对话。

运行 /context list 查看实际加载情况:5,803字符,96.2%上下文空间空闲

你们看,这其实不是什么高深的技术。说白了就是"别把所有鸡蛋放一个篮子里"——但在AI Agent的语境下,这一步大部分人就是没做。

QMD四步压缩:核心记忆只存20个关键词

文件拆好了,下一个关键问题:MEMORY.md里到底该存什么?

答案是:只存索引,不存内容。

这就要说到QMD了。QMD全称Query-Memory-Document,是Shopify创始人Tobi Lütke做的开源项目,完全本地运行,不需要API Key,数据不出你的电脑。它同时跑BM25关键词匹配和向量语义搜索两个通道,再用LLM重排序——说白了就是"又快又准的本地搜索引擎"。

以前你在MEMORY.md里写一大段"2月15日和张三开会讨论Q1预算,决定砍掉A项目增加B项目预算30%"。现在?只存几个关键词索引就够了,具体内容存在memory/2026-02-15.md日志里,QMD需要时自动检索。

但不是什么都该存。信息入库要过4条标准,至少满足2条:

影响长期决策——比如"A项目已取消",这决定了后续所有对话方向

会被重复使用——比如"用户偏好深色模式",每次生成UI都要参考

遗漏会造成损失——比如"API密钥下月到期",忘了就要出事

可操作可验证——具体的、能执行的信息,不是模糊的感受

海量信息压缩为精炼索引,四步完成

实测效果——

注意,不是优化了一点点,是一个数量级的差距。同样的AI、同样的对话量,一个月省出来的钱够再买好几个月的订阅。

🧠 AI的瓶颈从来不是智力——是你组织信息的方式

这件事让我想到一个更大的问题。

我们总觉得AI不够聪明、会幻觉、不靠谱。但你想想——如果你给一个实习生,把公司所有文件不分类地堆在他桌上,从营业执照到快递单全混在一起,然后要求他"记住所有内容"。他能不出错吗?

以前,我们觉得AI的瓶颈是算力和模型能力。现在回头看,真正的瓶颈是你怎么组织信息喂给它。一个配置合理的Agent,比一个算力翻倍但配置混乱的Agent,有用10倍。

这话放在职场里也一样。给一个聪明人一团乱麻的需求文档,不如给一个普通人一套清晰的SOP——你细品。

不是买更贵的工具,而是用对已有的工具

5分钟搞定,三步配置一劳永逸

第一步,拆文件。把臃肿的MEMORY.md拆成标准8文件。核心人格放SOUL.md(控制在15-20行、1KB以内),用户画像放USER.md,工具规则放TOOLS.md,日常记录放memory/日期.md。

第二步,装QMD。一行命令,完全本地化:

bun install -g https://github.com/tobi/qmd

# 在 openclaw.json 中设置

# memory.backend = "qmd"

第三步,在AGENTS.md里加两条规则:存记忆前过4条标准,至少满足2条才写入;回答问题前先跑memory_search,别瞎猜。

5分钟配置。之后你的OpenClaw从此告别失忆、告别天价账单。

工具的瓶颈正在消失,信息组织的瓶颈才刚刚开始。你的AI不笨,是你还没学会怎么"教"它记东西。

🦞 立即优化你的OpenClaw记忆

OpenClaw记忆文档:docs.openclaw.ai/concepts/memory

QMD项目(Tobi Lütke):github.com/tobi/qmd

完整优化指南:github.com/OnlyTerp/openclaw-optimization-guide

OpenClawAI AgentToken省钱效率提升AI工具

你的OpenClaw踩过"失忆"的坑吗?把你的经验打在评论区,帮后来人省点冤枉钱。

觉得有用就转发给同样在用的朋友——配置对了,体验真的天差地别。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O-7tTo3RoMilP3xwCYfb9-WA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

领券