文章/答案/技术大牛

发布

AI越聊越蠢——直到有人把记忆文件拆成了8层

文章来源：企鹅号 - 赛脖古

你有没有遇到过这种情况？跟AI聊了十几轮，它突然忘了你之前说的所有话，开始胡说八道。你以为是模型不行，其实99%的情况，是你的记忆配置在拖后腿——而且还在帮你烧钱。今天拆一下OpenClaw的记忆管理，怎么用8层架构+QMD压缩，10轮对话省88% Token。

聊着聊着就失忆，是你把AI用废了

做过AI Agent配置的都知道，最头疼的不是模型选型，不是Prompt调优，而是——聊着聊着，AI突然不认识你了。

你花了一小时跟它梳理项目方案，反复强调"A项目已经砍了"。第二天一开聊，它热情地问你："A项目的预算要不要调调？"你再强调一遍，它记住了。又过几轮，又忘了。

这不是模型的问题。OpenClaw——这个AI Agent项目——有一个机制：默认单文件上限2万字符，超了静默截断。不报错、不提醒，你最重要的指令可能已经被吃掉了，你完全不知道。

OpenClaw GitHub：33万星，60天超越React十年纪录

更厉害的是烧钱。以前每条消息5K Token，你往MEMORY.md里塞了一堆东西后膨胀到50K——费用直接翻10倍。一天100条消息，从2.25美元飙到22.5美元。一个月几百美元，换来一个越来越不靠谱的助手。

这背后其实是一个问题：99%的用户把所有东西堆在一个MEMORY.md里。偏好、项目记录、会议决策、代码片段——全在一起。就像把公司所有文件从营业执照到快递单锁在一个保险柜里，每次找东西都要翻一遍。

同样用OpenClaw，成本和体验差了一个量级

不是塞更多记忆，而是拆成8层按需加载

解决方案其实不复杂。关键认知转变就一句话：不是把所有东西让AI记住，而是让AI知道去哪找。

OpenClaw启动时只自动加载8个特定文件名：SOUL.md、AGENTS.md、USER.md、TOOLS.md、IDENTITY.md、HEARTBEAT.md、BOOTSTRAP.md和MEMORY.md。你那个叫notes.md、knowledge-base.md的笔记？AI压根看不见——这一点官方文档写了，但大部分人没注意到。

理解了这个机制，方案就清楚了——像操作系统一样分层管理：

优化后的workspace目录结构：8个标准文件 + daily日志

以前是AI每轮对话都背着一个50K Token的大书包；现在是带一本薄薄的索引目录，需要什么现查现取。所有配置文件加起来不超过10K Token，只占上下文窗口的4%，剩下96%全留给实际对话。

运行 /context list 查看实际加载情况：5,803字符，96.2%上下文空间空闲

你们看，这其实不是什么高深的技术。说白了就是"别把所有鸡蛋放一个篮子里"——但在AI Agent的语境下，这一步大部分人就是没做。

QMD四步压缩：核心记忆只存20个关键词

文件拆好了，下一个关键问题：MEMORY.md里到底该存什么？

答案是：只存索引，不存内容。

这就要说到QMD了。QMD全称Query-Memory-Document，是Shopify创始人Tobi Lütke做的开源项目，完全本地运行，不需要API Key，数据不出你的电脑。它同时跑BM25关键词匹配和向量语义搜索两个通道，再用LLM重排序——说白了就是"又快又准的本地搜索引擎"。

以前你在MEMORY.md里写一大段"2月15日和张三开会讨论Q1预算，决定砍掉A项目增加B项目预算30%"。现在？只存几个关键词索引就够了，具体内容存在memory/2026-02-15.md日志里，QMD需要时自动检索。

但不是什么都该存。信息入库要过4条标准，至少满足2条：

•影响长期决策——比如"A项目已取消"，这决定了后续所有对话方向

•会被重复使用——比如"用户偏好深色模式"，每次生成UI都要参考

•遗漏会造成损失——比如"API密钥下月到期"，忘了就要出事

•可操作可验证——具体的、能执行的信息，不是模糊的感受

海量信息压缩为精炼索引，四步完成

实测效果——

注意，不是优化了一点点，是一个数量级的差距。同样的AI、同样的对话量，一个月省出来的钱够再买好几个月的订阅。

🧠 AI的瓶颈从来不是智力——是你组织信息的方式

这件事让我想到一个更大的问题。

我们总觉得AI不够聪明、会幻觉、不靠谱。但你想想——如果你给一个实习生，把公司所有文件不分类地堆在他桌上，从营业执照到快递单全混在一起，然后要求他"记住所有内容"。他能不出错吗？

以前，我们觉得AI的瓶颈是算力和模型能力。现在回头看，真正的瓶颈是你怎么组织信息喂给它。一个配置合理的Agent，比一个算力翻倍但配置混乱的Agent，有用10倍。

这话放在职场里也一样。给一个聪明人一团乱麻的需求文档，不如给一个普通人一套清晰的SOP——你细品。

不是买更贵的工具，而是用对已有的工具

5分钟搞定，三步配置一劳永逸

第一步，拆文件。把臃肿的MEMORY.md拆成标准8文件。核心人格放SOUL.md（控制在15-20行、1KB以内），用户画像放USER.md，工具规则放TOOLS.md，日常记录放memory/日期.md。

第二步，装QMD。一行命令，完全本地化：

bun install -g https://github.com/tobi/qmd

# 在 openclaw.json 中设置

# memory.backend = "qmd"

第三步，在AGENTS.md里加两条规则：存记忆前过4条标准，至少满足2条才写入；回答问题前先跑memory_search，别瞎猜。

5分钟配置。之后你的OpenClaw从此告别失忆、告别天价账单。

工具的瓶颈正在消失，信息组织的瓶颈才刚刚开始。你的AI不笨，是你还没学会怎么"教"它记东西。

🦞 立即优化你的OpenClaw记忆

OpenClaw记忆文档：docs.openclaw.ai/concepts/memory

QMD项目(Tobi Lütke)：github.com/tobi/qmd

完整优化指南：github.com/OnlyTerp/openclaw-optimization-guide

OpenClawAI AgentToken省钱效率提升AI工具

你的OpenClaw踩过"失忆"的坑吗？把你的经验打在评论区，帮后来人省点冤枉钱。

觉得有用就转发给同样在用的朋友——配置对了，体验真的天差地别。

发表于: 2026-03-302026-03-30 07:06:35
原文链接：https://page.om.qq.com/page/O-7tTo3RoMilP3xwCYfb9-WA0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

AI越聊越蠢——直到有人把记忆文件拆成了8层

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐