首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏服务端技术杂谈

    用文件系统思路设计Agent记忆系统

    用户与Agent的多轮对话过程中会出现很多记忆,包括用户原始的意图、诉求、关键词,还包括Agent的推理、规划、工具调用的执行结果及模型最终的响应。 每轮对话背后,都由一个智能体记忆模块会进行会话信息提炼和通用信息整理,不断抽取用户偏好、画像、核心事实、个性化信息等,用于辅助Agent在后续对话中进行推理。 如果哪天底层切换存储组件,Agent层完全不需要感知,切换很灵活。 因为在接口层面做了抽象,所以可以很好的面向功能进行接口涉及,而无需关注这个功能接口究竟是用了一个文件系统还是多个类型的文件系统。 回过头来,我们看一下从用户提出问题,到最终Agent给出回答的整个流程如下。 最终实现类似于操作系统的文件系统能力,让智能体的记忆可追溯(每一步有据可查)、可审计(所有操作都有日志)、可演化(新组件无缝接入),整个Agent的记忆历史都是可以回溯的,而不是黑盒了。

    23510编辑于 2026-03-11
  • Agent 记忆系统的标准方案为何失效剖析

    开发者Rohit面试失败后,开始深入研究Agent记忆系统,最终构建出生产级方案。核心洞察:记忆是基础设施,不是功能。 Agent幻觉出错误的综合答案。问题根源:Embedding衡量的是相似性,不是真实性。向量数据库不理解时间、上下文或更新。短期记忆:Checkpointing每个Agent作为状态机运行。 Embedding,调整图谱边权重,归档冷数据推理时检索从上下文窗口约束反向工作:用合成查询广泛搜索搜索结果是候选,不是答案相关性评分×时间衰减=最终排序近期记忆往往击败六个月前的完美匹配结果:只注入5- Agent当操作系统,不是聊天机器人:RAM:当前对话的快速易失上下文硬盘:持久化、索引化的知识存储垃圾回收:定期维护,否则系统崩溃总结记忆系统的关键在于:不是存储,而是组织和衰减。 像操作系统管理内存一样管理记忆,Agent才能长期可靠地工作。

    14110编辑于 2026-02-12
  • 2026年Agent记忆系统方案横评与选型指南

    2026年Agent记忆系统方案横评与选型指南AI发展正经历从模型时代向智能体时代再向认知时代的跃迁。 伴随这一进程,Agent记忆系统由辅助模块跃升为核心基础设施,承担“让AI记住过去、理解未来”的使命,支撑跨会话、长周期、多任务的连续智能表现。 技术路线全景与阶段跃迁Agent记忆技术沿时间轴铺展为十余条路线,形成全局视图。 OS化记忆中枢:记忆系统成为Agent的操作系统级组件,统一管理多模态、多Agent共享状态。时间图谱深化:引入时间戳与因果边构建事件网络,支撑长周期推理与回溯。 从外挂工具到原生核心,记忆系统正经历从“辅助”到“定义”的蜕变,未来智能体将以持续懂你、跨会话不断线的能力,成为可信赖的第二大脑。

    29410编辑于 2026-05-07
  • Hermes Agent 三大核心能力详解:记忆系统、技能引擎与消息网关

    但如果要选出最能体现其差异化价值的三个能力,一定是:记忆系统——这是"越用越聪明"的基础技能引擎——这是"自我进化"的实现消息网关——这是"随时可达"的保障核心能力一:三层记忆架构第一层:短期工作记忆(

    1.1K20编辑于 2026-04-15
  • 来自专栏DeepHub IMBA

    instinct:一个基于置信度的 AI Agent 自学习记忆系统

    人去观察模式、记录下来、维护文件,Agent 只负责执行。 其实记忆应当是 Agent 在反复实践中习得的,而非人工分配的。 核心思想:基于置信度的学习 多数 AI Agent 记忆系统采用显式建模,即人写规则、Agent 遵照执行。 Model Context Protocol 是一个将 AI Agent 与外部工具连接的开放标准。 Agent 调用 suggest 时,返回结果同时包含全局模式和当前项目的专属模式。Python 项目的格式化偏好不会渗透到 Go 项目中。 到第五次会话,Agent 对工作流的熟悉程度已经超过一个新加入的团队成员。

    15310编辑于 2026-04-15
  • AI记忆系统对比

    一个好的记忆系统,本质上就是一个“抠门且高效的管家”,它能帮你把原本需要几万甚至几十万Token才能说清楚的事情,压缩到几百字。这不仅关乎钱包的厚度,更直接决定了应用的响应速度和用户体验。 以下是为您更新后的终极选型对比表,特别增加了【费用降低效果】列:记忆系统开发团队情况核心范式与特色主打场景/杀手锏费用降低效果(Token/CostSavings)上手难度与集成方式潜在槽点MemoriMemoriLabs SQL原生+全链路归因Agent原生记忆层,将交互自动转结构化持久状态。打造极致的多智能体协同,需要精确追踪“谁在什么时候做了什么”。 解决长尾上下文遗忘难题,需要Agent具备“举一反三”的学习力。高(智能压缩降耗)通过反射机制过滤无效信息,极大减少上下文窗口膨胀带来的边际成本。 端侧设备、极度追求隐私保护、零成本的微型Agent。极高(零额外推理费)纯数学运算,无任何外部LLM依赖,完全杜绝了Embedding和推理的API调用费。

    19010编辑于 2026-04-29
  • 来自专栏Elastic Stack专栏

    用 Elasticsearch 给 AI Agent 装一颗大脑:从零构建跨会话记忆系统

    这篇文章记录了我如何用 Elasticsearch 的原生能力,给 Agent 装上一套真正能用的长期记忆系统。 Elastic 近期推出的 Agent Builder 和 Workflows 这两个功能,让你不用写一行应用代码,就能把上面所有能力串成一个完整的记忆系统。 这意味着整个记忆系统的工具层,零应用代码。5.1 工具一:Save_Memory(写入记忆)这个工具让 AI 在对话过程中,把识别到的高价值信息写入 Elasticsearch。 六、串联起来:Agent 如何使用记忆配置好工具后,在 Agent Builder 中把这两个工具分配给你的 Agent,再在 system prompt 里加上记忆管理的指令。 写在最后我一直觉得,AI Agent 领域最被低估的问题不是"推理能力",而是"上下文工程"。模型越来越聪明,但如果你喂给它的上下文是垃圾,输出就是垃圾。记忆系统就是上下文工程的核心基础设施。

    12611编辑于 2026-04-30
  • 来自专栏Vegout

    Nanobot 记忆系统深度解析

    长期记忆是用户的第二大脑,不是日志" ❌ 不会自动把所有对话都塞进去 ❌ 没有复杂的自动摘要算法 ✅ 依赖 LLM 的推理能力判断"什么值得记住" ✅ 保持简洁,只存真正重要的信息 总结 nanobot 的记忆系统通过分层设计解决了记忆膨胀问题

    46910编辑于 2026-03-13
  • 来自专栏服务端技术杂谈

    智能体记忆系统

    比如你是一个素食主义者,但因为智能体记忆缺陷,Agent给你推荐了烤肉,这会降低你对Agent的信任感。 更长的上下文会显著增加大模型的推理延迟,带来高昂的Token成本。 为了解决这一问题,业界开源了Mem0长期记忆系统。 它通过动态的提取、整合、检索对话中的关键信息,赋予了智能体长期记忆的能力。 底座是包含向量数据库和知识图谱架构设计。 这样memory记住的不是原始的对话,而是结构化的事实,让Agent更好掌握对话实质内容。 这些结构化信息将作为后续存储和检索的基础。 向量存储,解决的是语义理解。 最有效的记忆系统会将语义相似性搜索和关系遍历相结合的混合搜索。 当用户问:“其他具有相似风险偏好的客户提出过哪些投资担忧?”

    36011编辑于 2026-03-11
  • 来自专栏机器之心

    400篇参考文献重磅综述,统一调查「人脑×Agent记忆系统

    记忆系统奠定理论基石。 因此,记忆超越了其作为桥接历史交互的被动存储库的角色,而是充当 Agent 认知架构中的关键主动组件。因此,给 Agent 装上记忆系统,并非只是为了记住,而是为了实现三大核心作用: 图 1. 2.Agent 中的记忆存储 不同于人脑浑然天成的神经网络,Agent记忆系统是显式的工程构建。 Agent 记忆系统评测 综述将现有的 Benchmark 分为了两类: 面向语义(Semantic-oriented):重点关注 Agent 如何构建、维护和利用其内部记忆中的信息状态。 面向情景(Episodic-oriented):旨在评估复杂下游应用场景(使用外部工具完成任务)中 Agent记忆系统的实际性能增益。 表 1. 面向语义的基准 表 2.

    40210编辑于 2026-01-12
  • 来自专栏CSDN技术头条

    未来5-10年,NLP将走向成熟

    未来5-10年,NLP将走向成熟 最后,再介绍一下我对自然语言处理目前存在的问题以及未来的研究方向的一些考虑,供大家参考。

    1.3K71发布于 2018-02-12
  • Hermes Agent 持久记忆系统彻底解决上下文丢失

    (不仅记得技术栈,还记得历史操作记录)记忆系统的技术细节写入机制记忆不是简单的"保存聊天记录"。 /project-docs/开始体验要充分体验记忆系统的价值,建议持续使用至少一周。在云端部署可以确保Agent持续运行,记忆不断积累。 Q3:如何防止Agent记住不该记住的信息?A:可以在对话中明确告诉Agent"不要记住这个",也可以在config中配置记忆过滤规则。

    66710编辑于 2026-04-16
  • 来自专栏AI SPPECH

    MCP 与长期记忆系统结合

    通过分析长期记忆在 Agent 系统中的核心作用,详细阐述 MCP 与向量数据库、知识图谱等记忆系统的集成机制。 )的一个重要设计目标就是支持与长期记忆系统的深度集成,通过标准化的接口和协议,让 Agent 能够高效地存储、检索和利用长期记忆。 1.3 行业动态与技术趋势 当前,长期记忆系统已成为 AI Agent 领域的研究热点。 五、实际工程意义、潜在风险与局限性分析 5.1 实际工程意义 MCP 与长期记忆系统的结合在实际工程中具有重要意义: 提高 Agent 智能水平:赋予 Agent 持续学习和知识积累的能力,提高其决策质量和适应性 支持复杂任务:长期记忆支持 Agent 处理复杂的多步任务和长期项目 促进知识共享:不同 Agent 之间可以共享记忆资源,促进知识的传播和复用 5.2 潜在风险 尽管 MCP 与长期记忆系统的结合具有诸多优势

    38210编辑于 2026-01-08
  • 来自专栏IT技术分享社区

    OpenClaw成本控制:从月花$1000+到$20,API Token优化指南

    多轮推理:一个任务,多次调用普通聊天是“你问一句,AI答一句”,一次对话只触发一次API调用;但OpenClaw的Agent是“自主思考”,一个简单任务,可能会触发5-10次甚至更多API调用。 比如让Agent处理一封邮件,它会先调用API解析邮件内容,再调用API判断优先级,接着调用API生成回复,最后调用API记录到记忆系统——这一套流程下来,Token消耗是单次聊天的好几倍。 上下文叠加:每次调用,都要“带行李”OpenClaw有记忆系统(MEMORY.md + Daily Logs),为了让Agent“记住”之前的操作和任务,每次调用API时,都会附带完整的上下文内容。 社区里最经典的踩坑案例:有用户设置了Agent处理邮件的cron任务,晚上睡觉前一切正常,第二天早上发现API账单暴涨到$1100,原因就是Agent处理邮件时进入了循环推理,一整晚不停调用API,相当于 减少上下文冗余上下文叠加是Token消耗的主要原因之一,我们可以通过两个简单操作,减少冗余上下文,降低消耗:精简记忆系统:只保留必要的记忆内容(比如核心任务记录、常用配置),删除不必要的Daily Logs

    2.3K103编辑于 2026-03-18
  • 来自专栏Hermes Agent 爱马仕

    🔥🔥🐎 Hermes Agent vs 🦞OpenClaw:本地部署全方位对比,到底该养“马”还是养“虾”?

    关键词:HermesAgent、OpenClaw、本地部署、AI智能体、自我进化、多Agent协作、Python、TypeScript、WSL2、Ollama标签:#HermesAgent#OpenClaw 一行命令搞定✅官方脚本,一行命令搞定依赖处理自动安装Python、Node.js等需手动确保Node.js环境Windows支持✅原生PowerShell部署/WSL2⚠️需WSL2,原生支持有限安装时间约5- 第二部分:技术架构与资源消耗对比2.1技术栈对比对比项HermesAgentOpenClaw编程语言Python(轻量、易读)TypeScript(工程化)架构风格单核心Agent驱动Gateway+编排 第三部分:核心能力对比3.1记忆系统:原生自动vs手动维护这是两者最核心的差异之一。 推荐:HermesAgent理由:自我进化机制让它在长期使用中越来越贴合你的习惯;分层记忆系统能记住你的偏好而不爆token;轻量化部署,旧电脑也能跑。

    1.1K00编辑于 2026-04-21
  • 为什么你的AI Agent聊着聊着就“跑偏”了?不是模型笨,是7大机制在“作妖”!附8大架构神器,彻底治愈“老年痴呆”

    为什么你的AI Agent聊着聊着就“跑偏”了?不是模型笨,是7大机制在“作妖”! 没有固定优先级,用户就感觉Agent越来越“健忘”、越来越前后不一。 采用分层记忆系统 • 短期记忆:保留最近交互细节 • 长期记忆:只存稳定事实 • 任务记忆:只存当前任务结论 三层各司其职,别一股脑全塞进一个memory。 3. 周期性“重锚定” 每隔5-10轮,让Agent内部(或输出)重建一次: • 我现在到底在解决什么? • 什么绝对不能做? • 哪些结论已经100%确认? • 下一步只做哪一件事? 最后想说 AI Agent的“跑偏”不是命运,而是架构问题。把上面这些机制改好,你会发现:同一个模型,同一个任务,长对话也能稳如老狗。 你最近的Agent有没有出现过“越聊越偏”的情况?

    21110编辑于 2026-04-21
  • 来自专栏人工智能头条

    未来5-10年,自然语言处理将走向成熟

    未来5-10年,NLP将走向成熟 最后,再介绍一下我对自然语言处理目前存在的问题以及未来的研究方向的一些考虑,供大家参考。

    75330发布于 2018-07-20
  • 今天 AI 记忆系统又进了一步:Engram、Claude Code、EdgeClaw 正在把“长期记忆”做成工程能力

    今天 AI 记忆系统又进了一步:Engram、Claude Code、EdgeClaw 正在把“长期记忆”做成工程能力 最近一波关于 AI Agent 记忆系统的更新,很值得放在一起看。 先说结论:记忆系统开始从功能点走向架构层 过去很多 Agent 的“记忆”,本质上还是向量库加检索片段。 这对于希望把 Agent 真正跑成“长期服务”的团队来说,非常关键。 记忆系统正在从“外挂检索”走向“原生架构” 过去的做法,常常是先有 Agent,再额外挂一个 RAG 或向量库。 现在的变化是:记忆已经不再是附加模块,而是开始进入系统设计的一开始。 ,记忆系统已经越来越像数据库、检索系统、知识治理系统和 Agent 调度系统的混合体。

    28610编辑于 2026-04-09
  • 理解 RAG:大模型的外部记忆系统是如何工作的

    无论是企业知识问答、智能客服,还是 Agent 记忆系统,几乎都离不开它的支持。 LLM 模型 生成回答 GPT、Claude、Gemini、Mistral Evaluation 检索评估 RAGAS、TruLens、BLEU/ROUGE RAG 的进化:从被动检索到主动记忆 随着 Agent 概念兴起,RAG 开始朝着"有意识的记忆系统"方向演化。 简而言之: ❝RAG 让模型"能查资料"; 这些记忆系统让模型"能记得事"。 未来的智能体(Agent)将不再只是“查知识”, 而是真正地“拥有经验与认知”。

    95310编辑于 2025-11-13
  • 来自专栏张善友的专栏

    为 openclaw.net 集成 ElBruno.MempalaceNet 记忆系统

    4.1.1.1 agent:{user_id} 用户实体 agent 类型在时序知识图谱中代表具有自主行为能力的参与者,其最自然的映射即为 openclaw.net 的用户体系 。 agent 实体的属性设计需涵盖用户画像的静态维度与动态维度。 participated-in 表示一般性参与,适用于任何加入会话的 agent;initiated 表示发起性参与,特指创建会话的 agent。 5.4.2 外部工具调用与记忆反馈循环 外部工具调用与记忆系统的反馈闭环是复杂推理任务的关键支撑 。 多用户组织共享或隔离 支持租户级 ACL Session Room 新会话默认创建 Room,主题相似时复用 动态聚类算法 Message Memory in Drawer 按时间窗口+语义内聚分发 5-

    17710编辑于 2026-05-04
领券