用户与Agent的多轮对话过程中会出现很多记忆,包括用户原始的意图、诉求、关键词,还包括Agent的推理、规划、工具调用的执行结果及模型最终的响应。 每轮对话背后,都由一个智能体记忆模块会进行会话信息提炼和通用信息整理,不断抽取用户偏好、画像、核心事实、个性化信息等,用于辅助Agent在后续对话中进行推理。 如果哪天底层切换存储组件,Agent层完全不需要感知,切换很灵活。 因为在接口层面做了抽象,所以可以很好的面向功能进行接口涉及,而无需关注这个功能接口究竟是用了一个文件系统还是多个类型的文件系统。 回过头来,我们看一下从用户提出问题,到最终Agent给出回答的整个流程如下。 最终实现类似于操作系统的文件系统能力,让智能体的记忆可追溯(每一步有据可查)、可审计(所有操作都有日志)、可演化(新组件无缝接入),整个Agent的记忆历史都是可以回溯的,而不是黑盒了。
开发者Rohit面试失败后,开始深入研究Agent记忆系统,最终构建出生产级方案。核心洞察:记忆是基础设施,不是功能。 Agent忘记了用户是素食者。问题根源:对话历史不是记忆,只是聊天日志。方案二:向量数据库检索两周后,数据库积累了500条记录。用户问"我的工作情况",向量检索返回12段矛盾片段。 Agent幻觉出错误的综合答案。问题根源:Embedding衡量的是相似性,不是真实性。向量数据库不理解时间、上下文或更新。短期记忆:Checkpointing每个Agent作为状态机运行。 Agent当操作系统,不是聊天机器人:RAM:当前对话的快速易失上下文硬盘:持久化、索引化的知识存储垃圾回收:定期维护,否则系统崩溃总结记忆系统的关键在于:不是存储,而是组织和衰减。 像操作系统管理内存一样管理记忆,Agent才能长期可靠地工作。
2026年Agent记忆系统方案横评与选型指南AI发展正经历从模型时代向智能体时代再向认知时代的跃迁。 伴随这一进程,Agent记忆系统由辅助模块跃升为核心基础设施,承担“让AI记住过去、理解未来”的使命,支撑跨会话、长周期、多任务的连续智能表现。 其记忆系统以纯Markdown为单一源真理,结合SQLite-vec实现70%向量余弦相似+30%BM25+MMR+时间衰减的混合检索,分层为L1短期会话、L2工作空间核心MD文件、L3长期MEMORY.md 其四层渐进式记忆架构定义为:L0原始对话全量保存;L1原子记忆自动提取事实、偏好与关键约束;L2场景分块按项目聚类实现上下文精准召回;L3用户画像形成稳定个性化认知。 OS化记忆中枢:记忆系统成为Agent的操作系统级组件,统一管理多模态、多Agent共享状态。时间图谱深化:引入时间戳与因果边构建事件网络,支撑长周期推理与回溯。
但如果要选出最能体现其差异化价值的三个能力,一定是:记忆系统——这是"越用越聪明"的基础技能引擎——这是"自我进化"的实现消息网关——这是"随时可达"的保障核心能力一:三层记忆架构第一层:短期工作记忆( deploy-nextjs-appdescription:部署Next.js应用到服务器version:1.2triggers:["部署Next.js","上线前端项目"]---##执行步骤1.检查Node.js版本(需要18+)2. Clone项目仓库3.安装依赖`npminstall`4.构建项目`npmrunbuild`5.配置PM2进程管理6.设置Nginx反向代理7.配置SSL证书(Let'sEncrypt)##注意事项-确认服务器内存 >=2GB-检查端口3000是否被占用三级渐进式加载为了优化token使用,技能系统采用渐进式加载:加载级别内容Token消耗Level1技能名称+一句话描述~20tokensLevel2详细描述+参数说明 Q2:可以手动导入记忆吗?A:可以。你可以通过CLI命令或直接编辑数据库来导入预设记忆,例如项目文档、团队规范等。Q3:消息网关的稳定性如何?
在构建 AI 智能体系统或多模块任务执行架构时,我们常会遇到三个关键术语: Agent to Agent 链式函数调用 Agent2Agent (A2A) 它们看似类似,甚至常被混用,但实际上分别属于不同的抽象层次 (A2A)│ ← 架构范式(设计) └─────────────────┘ 这意味着: 链式函数调用是编程行为 Agent to Agent是通信语义 Agent2Agent (A2A) 是系统设计理念 两个 Agent 间的信息传递行为 多智能体协同、机器人通信 Agent2Agent (A2A) 系统架构层 一个 Agent 主动调用其他 Agent 协作解决问题 LLM Agent 编排、AutoGen Agent2Agent 像一个“项目经理型 AI”会调度多个“专家型 AI”组成动态团队,解决复杂任务 类比一句话总结: 链式函数调用像拼装生产线,Agent to Agent像员工交流,而Agent2Agent Agent2Agent (A2A 调用链) class PlannerAgent: def run(self, task): data = fetch_agent.run("get
核心思想:基于置信度的学习 多数 AI Agent 记忆系统采用显式建模,即人写规则、Agent 遵照执行。 2、合并 会话结束时(或定期),运行 consolidate 触发自动晋升: instinct consolidate # Promoted to mature: 3 # Promoted to # pref:stdlib-first conf=12 [rule] preference # 2 suggestions 只有 mature 和 rule 级别的模式会返回。 promoted 字段对应成熟度等级:0 = raw,1 = mature,2 = rule。metadata 列存储任意 JSON,用于在不做 schema 迁移的前提下扩展功能。 store.observe("seq:test->fix->test", source="claude-code") store.observe("seq:test->fix->test") # 置信度现在 = 2
script]# 默认情况下 zabbix_agentd 会监听在 0.0.0.0:10050 上面,所以要将防火墙打开,以方便与zabbix server之间的通信 ---- 启动zabbix-agent [root@zbx-target zabbix]# /etc/init.d/zabbix-agent start Starting Zabbix agent: S 16:11 0:00 \_ zabbix_agentd: listener #2 [waiting for connection] zabbix 26129 0.0 0.0 77336
一个好的记忆系统,本质上就是一个“抠门且高效的管家”,它能帮你把原本需要几万甚至几十万Token才能说清楚的事情,压缩到几百字。这不仅关乎钱包的厚度,更直接决定了应用的响应速度和用户体验。 SQL原生+全链路归因Agent原生记忆层,将交互自动转结构化持久状态。打造极致的多智能体协同,需要精确追踪“谁在什么时候做了什么”。 极高(降耗80%~96%)L0/L1/L2分层加载;实测最高可降低96%的Token成本,提升43%的任务完成率。⭐⭐⭐(中)原生深度集成OpenClaw,支持MCP协议。 解决长尾上下文遗忘难题,需要Agent具备“举一反三”的学习力。高(智能压缩降耗)通过反射机制过滤无效信息,极大减少上下文窗口膨胀带来的边际成本。 ⭐⭐(易)2行代码API替换,支持Docker一键部署。针对极度复杂的业务逻辑,初期的配置与调试门槛偏高。Holographic独立开发者/学术研究基于全息关联记忆理论的数学库。
S 17:02 0:00 \_ zabbix_agentd: listener #2 [waiting for connection] zabbix 26933 0.0 0.0 77388
zbx-target zabbix]# /etc/init.d/zabbix-agent start Starting Zabbix agent: S 16:11 0:00 \_ zabbix_agentd: listener #2 [waiting for connection] zabbix 26129 0.0 0.0 77336 0:off 1:off 2:off 3:off 4:off 5:off 6:off [root@zbx-target zabbix]# chkconfig zabbix-agent on [ root@zbx-target zabbix]# chkconfig --list | grep zabbix zabbix-agent 0:off 1:off 2:on 3:on 4:on 5 CPU.NUMBER}":0,"{#CPU.STATUS}":"online"},{"{#CPU.NUMBER}":1,"{#CPU.STATUS}":"online"},{"{#CPU.NUMBER}":2,
这篇文章记录了我如何用 Elasticsearch 的原生能力,给 Agent 装上一套真正能用的长期记忆系统。 Elastic 近期推出的 Agent Builder 和 Workflows 这两个功能,让你不用写一行应用代码,就能把上面所有能力串成一个完整的记忆系统。 关键设计点是 memory_text 的多字段结构:PUT ai-agent-memory-v2{ "settings": { "default_pipeline": "agent-memory-pipeline 2. 越用越聪明,但也会遗忘importance_score 和 ttl_days 的组合让 Agent 像人一样工作:核心偏好记得牢,短期细节自然淡忘。 写在最后我一直觉得,AI Agent 领域最被低估的问题不是"推理能力",而是"上下文工程"。模型越来越聪明,但如果你喂给它的上下文是垃圾,输出就是垃圾。记忆系统就是上下文工程的核心基础设施。
核心问题:记忆膨胀如何解决 2. 三层记忆架构 3. 分层记忆加载详解 4. Tier 3 记忆的唤醒机制 5. 什么样的记忆会进入长期记忆 6. ───────────────────────┘ ↓ ┌─────────────────────────────────────────────────────────────┐ │ Layer 2: ──────────────────────────┘ ↓ ┌────────────────────────────────────────────────────────────┐ │ Step 2: ────────────────────────────────────────────┘ 设计对比 层级 类比人类大脑 设计原因 Tier 1 工作记忆 关键信息需要 LLM 随时知道 Tier 2 长期记忆是用户的第二大脑,不是日志" ❌ 不会自动把所有对话都塞进去 ❌ 没有复杂的自动摘要算法 ✅ 依赖 LLM 的推理能力判断"什么值得记住" ✅ 保持简洁,只存真正重要的信息 总结 nanobot 的记忆系统通过分层设计解决了记忆膨胀问题
比如你是一个素食主义者,但因为智能体记忆缺陷,Agent给你推荐了烤肉,这会降低你对Agent的信任感。 更长的上下文会显著增加大模型的推理延迟,带来高昂的Token成本。 为了解决这一问题,业界开源了Mem0长期记忆系统。 它通过动态的提取、整合、检索对话中的关键信息,赋予了智能体长期记忆的能力。 底座是包含向量数据库和知识图谱架构设计。 这样memory记住的不是原始的对话,而是结构化的事实,让Agent更好掌握对话实质内容。 这些结构化信息将作为后续存储和检索的基础。 向量存储,解决的是语义理解。 最有效的记忆系统会将语义相似性搜索和关系遍历相结合的混合搜索。 当用户问:“其他具有相似风险偏好的客户提出过哪些投资担忧?”
Agent2安装: 1.关闭防火墙 sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config systemctl disable -y 5.查看命令 ls -l /usr/sbin/zabbix_agent2 -rwxr-xr-x. 1 root root 17608104 Apr 26 16:27 /usr/sbin/zabbix_agent2 6.启动客户端 systemctl enable --now zabbix-agent2 7.配置agent2配置文件 找到Server、ServerActive、Hostname并对应填进去 vi =oracle11g(主机的名字) 显示刚刚修改的内容命令 grep -Ev '^#|^$' /etc/zabbix/zabbix_agent2.conf 8.最后重启zabbix-agent2 systemctl restart zabbix-agent2
记忆系统奠定理论基石。 因此,记忆超越了其作为桥接历史交互的被动存储库的角色,而是充当 Agent 认知架构中的关键主动组件。因此,给 Agent 装上记忆系统,并非只是为了记住,而是为了实现三大核心作用: 图 1. 2.Agent 的双维度记忆分类 综述中指出,连贯的记忆分类对于系统地理解和设计 Agent 系统中的记忆机制至关重要。为了适应复杂的自主任务,综述提出了一套双维度的分类法。 图 2. 2.Agent 中的记忆存储 不同于人脑浑然天成的神经网络,Agent 的记忆系统是显式的工程构建。 面向情景(Episodic-oriented):旨在评估复杂下游应用场景(使用外部工具完成任务)中 Agent 上记忆系统的实际性能增益。 表 1. 面向语义的基准 表 2.
第2天:你:帮我加个用户注册页面。AI:好的,你用的是什么框架?数据库是什么?...第30天:你:帮我优化一下首页的性能。AI:好的,你的技术栈是什么?... (不仅记得技术栈,还记得历史操作记录)记忆系统的技术细节写入机制记忆不是简单的"保存聊天记录"。 /project-docs/开始体验要充分体验记忆系统的价值,建议持续使用至少一周。在云端部署可以确保Agent持续运行,记忆不断积累。 Q2:记忆可以导出和迁移吗?A:可以。记忆存储在SQLite数据库文件中,直接复制~/.hermes/memory.db即可迁移。Q3:如何防止Agent记住不该记住的信息? A:可以在对话中明确告诉Agent"不要记住这个",也可以在config中配置记忆过滤规则。
Agent 间通信模式概述 Agent2Agent(A2A)协议是旨在实现不同 AI Agent 框架间通信与协作的开放标准。 此外,Auth0 和 SAP 正在将 A2A 支持集成到其平台和 Agent 中。 作为开源协议,A2A 欢迎社区贡献,以促进其发展和广泛采用。 A2A 的核心概念 A2A 协议为 Agent 交互提供结构化方法,建立在若干核心概念之上。深入理解这些概念对任何开发或集成 A2A 兼容系统者都至关重要。 核心参与者:A2A 涉及三个主要实体: 用户:发起对 Agent 协助的请求。 A2A 客户端(客户端 Agent):代表用户请求操作或信息的应用程序或 AI Agent。 视觉摘要 ** ** 图 2:A2A Agent 间通信模式 关键要点 关键要点: Google A2A 协议是开放、基于 HTTP 的标准,促进使用不同框架构建的 AI Agent 间通信协作。
横空大气排山去,砥柱人间是此峰 牛兆濂《登华岳南峰极顶七绝》 Zabbix Agent2监控docker容器 首先我们先来看一下zabbix agent2监控docker插件的实现原理,其实就是通过调用 docker的API来获取数据,插件目录位于zabbix-agent2/src/go/plugins/docker,我们先来看一下client.go文件 这里就是定义了使用UNIX套接字地址来进行docker 了解了docker插件的实现思路后我们可以根据我们的需求进行扩展,添加对应的api获取数据就可以了,或者根据这个思路在zabbix agent上实现相同的自定义脚本,甚至可以根据docker插件的实现逻辑来自己编写插件实现其他的监控需求 下面我们来使用agent2的模板监控docker 链接docker模板 ?
通过分析长期记忆在 Agent 系统中的核心作用,详细阐述 MCP 与向量数据库、知识图谱等记忆系统的集成机制。 )的一个重要设计目标就是支持与长期记忆系统的深度集成,通过标准化的接口和协议,让 Agent 能够高效地存储、检索和利用长期记忆。 1.3 行业动态与技术趋势 当前,长期记忆系统已成为 AI Agent 领域的研究热点。 五、实际工程意义、潜在风险与局限性分析 5.1 实际工程意义 MCP 与长期记忆系统的结合在实际工程中具有重要意义: 提高 Agent 智能水平:赋予 Agent 持续学习和知识积累的能力,提高其决策质量和适应性 支持复杂任务:长期记忆支持 Agent 处理复杂的多步任务和长期项目 促进知识共享:不同 Agent 之间可以共享记忆资源,促进知识的传播和复用 5.2 潜在风险 尽管 MCP 与长期记忆系统的结合具有诸多优势
既然 Zabbix agent 功能已经如此强大,为什么我们还要考虑使用 Zabbix agent2 ? Zabbix Agent 2 的主要目标是更加灵活便捷地扩展 agent 的指标采集功能。 无论对于新的原生 Zabbix agent 2 指标的内部开发还是我们社区完成的自定义 Zabbix agent 2 插件开发都是如此。 agent 2 插件 Zabbix agent 2 的底层结构基于 GO 插件。这种方法用于官方 Zabbix agent 2 监控项,并应用于开发自定义社区扩展。 可加载插件 我们来总结一下 Zabbix agent 2 插件的逻辑: 外部插件可在 Zabbix agent 2 启动时加载,无需重新编译 Zabbix agent 2 在 Linux 上使用 Unix 这意味着要运行 Zabbix agent 2,您必须为 GO 语言支持提供一组依赖。这样就可以编译安装 Zabbix agent 2。