首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Vegout

    Nanobot 记忆系统深度解析

    Tier 3 记忆的唤醒机制 5. 什么样的记忆会进入长期记忆 6. 总结 核心问题:记忆膨胀如何解决 问题背景 随着使用时间越长,nanobot 积累的记忆会越来越多。 长期记忆是用户的第二大脑,不是日志" ❌ 不会自动把所有对话都塞进去 ❌ 没有复杂的自动摘要算法 ✅ 依赖 LLM 的推理能力判断"什么值得记住" ✅ 保持简洁,只存真正重要的信息 总结 nanobot 的记忆系统通过分层设计解决了记忆膨胀问题

    39110编辑于 2026-03-13
  • 来自专栏服务端技术杂谈

    智能体记忆系统

    为了解决这一问题,业界开源了Mem0长期记忆系统。 它通过动态的提取、整合、检索对话中的关键信息,赋予了智能体长期记忆的能力。 底座是包含向量数据库和知识图谱架构设计。 最有效的记忆系统会将语义相似性搜索和关系遍历相结合的混合搜索。 当用户问:“其他具有相似风险偏好的客户提出过哪些投资担忧?”

    30711编辑于 2026-03-11
  • 来自专栏AI SPPECH

    MCP 与长期记忆系统结合

    retrieved_memories = memory_manager.retrieve( query="北京天气", context={"current_user": "alice"}, limit=5, 检索记忆 retrieved_memories = retriever.retrieve( query="北京天气", context=current_context, limit=5, 冬季寒冷干燥 相似度: 0.7890 相关性评分: 0.8234 记忆 4: 北京今天的空气质量指数:优,PM2.5 浓度 20μg/m³ 相似度: 0.7567 相关性评分: 0.7890 记忆 5: MCP v2.0 实现了多记忆系统的协作机制,能够根据不同的查询需求,选择合适的记忆系统进行检索: 查询路由:根据查询类型和需求,将查询路由到合适的记忆系统 结果融合:将来自不同记忆系统的检索结果进行融合和排序 系统切换:当某个记忆系统不可用时,自动切换到备用系统 负载均衡:在多个记忆系统间均衡分配查询请求,提高系统性能和可靠性 3.9 MCP 记忆系统的性能优化 3.9.1 性能优化策略 MCP v2.0

    31710编辑于 2026-01-08
  • 来自专栏服务端技术杂谈

    用文件系统思路设计Agent记忆系统

    如果想让智能体更好的服务用户,精准的记住用户的偏好和历史交互细节等信息就非常重要。

    18710编辑于 2026-03-11
  • Agent 记忆系统的标准方案为何失效剖析

    开发者Rohit面试失败后,开始深入研究Agent记忆系统,最终构建出生产级方案。核心洞察:记忆是基础设施,不是功能。 Embedding,调整图谱边权重,归档冷数据推理时检索从上下文窗口约束反向工作:用合成查询广泛搜索搜索结果是候选,不是答案相关性评分×时间衰减=最终排序近期记忆往往击败六个月前的完美匹配结果:只注入5- 写的是垃圾记忆当聊天历史—聊天历史短暂,记忆是结构化表示核心心智模型把Agent当操作系统,不是聊天机器人:RAM:当前对话的快速易失上下文硬盘:持久化、索引化的知识存储垃圾回收:定期维护,否则系统崩溃总结记忆系统的关键在于

    12310编辑于 2026-02-12
  • 智能体记忆系统检索优化:告别“答非所问”的实战指南

    摘要 在AI智能体应用日益普及的今天,记忆系统检索不相关结果已成为制约用户体验的核心痛点。 这些“答非所问”背后的元凶,往往是智能体记忆系统检索不相关。本文将深入剖析这一痛点,并提供切实可行的优化方案。 正文 一、记忆检索的三大核心挑战 智能体记忆系统检索不相关主要源于三大挑战。 动态分层索引机制 根据不同场景特点采用差异化索引策略,如下表所示: 索引类型 适用场景 优势特点 实时索引 新闻/价格变动 数据变更后5秒内可检索 领域分层索引 医疗/法律专业领域 精准匹配专业术语 版本控制索引 结语 在AI智能体应用爆发式增长的今天,智能体记忆系统检索优化已成为提升用户体验的关键。

    35010编辑于 2025-10-29
  • 基于 MemOS 大模型长记忆系统的架构实践与场景落地

    记忆张量团队依托在数据智能、知识图谱领域的技术积淀(核心团队曾主导阿里千亿级数字商业知识图谱构建),研发出 MemOS 大模型长记忆系统,聚焦解决大模型记忆能力短板,同时适配轻量化部署,为架构师提供可复用的长记忆技术落地方案 智能协作:Unity 中国游戏开发效率提升 Unity 中国(技术经理范乃如)将 MemOS 与旗下 Vibe Coding 工具结合,打造游戏开发智能协作新空间: 通过 MemOS 记忆系统存储游戏开发中的代码规范 技术价值与架构复用性 MemOS 大模型长记忆系统的架构实践,为架构师提供三大可复用价值: 技术层面:长记忆算法模块(如 MemScheduler 调度逻辑、PD 分离协同方案)可独立集成至现有大模型应用架构 5. (OpenAI 官方技术报告) [5] 强哥,大模型推理中的 Prefill/Decode 分离技术的一些思考 [EB/OL]. CSDN 博客,2025-10-21.

    1.5K20编辑于 2026-01-07
  • 来自专栏AI人工智能

    智能体的记忆系统:短期记忆、长期记忆与知识图谱

    本文将深入探讨这些技术,并通过Python/PyTorch代码示例,展示如何实现智能体的记忆系统。智能体记忆系统概述智能体的记忆系统是其核心组件之一,负责存储和管理与环境交互过程中获得的信息。 ShortTermMemory(max_size=50)stm.add_memory("用户询问了关于Python的问题")recent_memories = stm.get_recent_memories(5) ]) if row[3] else None, 'created_at': row[4], 'importance_score': row[5] self.index = simple_index self.texts.extend(texts) def search(self, query: str, k: int = 5) * len(texts), ids=ids ) def query_memories(self, query: str, n_results: int = 5)

    1.6K00编辑于 2025-07-14
  • 来自专栏DeepHub IMBA

    向量存储vs知识图谱:LLM记忆系统技术选型

    本文会从问题本身出发,看看构建高效记忆系统需要什么,比较不同架构方案,以及市面上有哪些开源和商业化的实现。 袖珍型事实这块,可以参考ChatGPT的记忆系统。它们大概率用了一个分类器判断某条消息是否包含需要存储的事实。 开源方案 下面是我整理的一些搭建记忆系统的独立解决方案,包括实现原理、架构选择和框架成熟度。 高级LLM应用开发还是个很新的领域,这些方案基本都是最近一两年才出现的。 最后总结 虽然有记忆系统支持,但是也别指望完美。这些系统还是会出现幻觉或者漏掉答案。现在没有系统能做到完美准确,至少目前还没有。研究表明幻觉是LLM固有特性,加记忆层也消除不了这个问题。 希望本文能帮新手理解LLM记忆系统的实现思路。 作者:Ida Silfverskiöld 喜欢就关注一下吧: 点个 在看 你最好看!

    34510编辑于 2025-11-15
  • 理解 RAG:大模型的外部记忆系统是如何工作的

    无论是企业知识问答、智能客服,还是 Agent 记忆系统,几乎都离不开它的支持。 历史与发展脉络 原理与关键技术(包括“向量”的通俗解释) 与传统检索技术(倒排索引、图索引)的区别 在 LLM 记忆体系中的角色与局限 常见的向量模型、组件与开源框架 以及 RAG 的进化方向 —— 以 长期记忆系统为代表的 "主动记忆系统" RAG 的起源与发展 RAG 的概念最早出现在 Facebook AI(Meta AI) 2020 年的论文: ❝Lewis et al., “Retrieval-Augmented 代表性技术包括 MemGPT、LangGraph Memory 等,以及结合摘要、反思、遗忘机制的长期记忆系统概念。 简而言之: ❝RAG 让模型"能查资料"; 这些记忆系统让模型"能记得事"。

    82110编辑于 2025-11-13
  • 来自专栏DeepHub IMBA

    LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习

    构建代理架构 在使用记忆系统工作流之前,需要构建使用它的智能代理。因为本文专注于记忆管理,所以只会构建一个中等复杂的电子邮件助手,模拟在真实场景中探索记忆的工作方式。 Draft emails using write_email. 5. For meetings, check availability and schedule accordingly. Question(content) - Ask follow-up questions 5. 每种选择都为记忆系统提供了不同且有价值的信号。 长期记忆系统的工作原理 我们通过本文已经看到代理从反馈中学习,但是背后发生了什么呢?这是一个简单而强大的四步循环,将更正转化为代理的新规则。 整个过程的分解: 反馈是触发器。

    1.1K10编辑于 2025-11-15
  • 来自专栏软件深度评测

    如何在 FlowUs、Notion 等笔记软件中使用间隔重复记忆系统

    那么,为了强化记忆,便需要根据记忆的遗忘规律,使用对抗的记忆系统。这便是间隔重复,主张按照一定的间隔对你的所学知识进行复习,以便将你新学习的内容固定到你的脑海。 为你的笔记软件加上记忆系统目前,在各大应用市场只有极少数软件内置了间隔重复系统,比如国外的双链大纲编辑器 RemNote. 那么,对于绝大多数没有间隔重复功能的笔记软件而言,我们如何将间隔重复这种高效的记忆系统与自己的笔记软件联动起来呢?在介绍我对解决办法之前,我先对我的笔记软件进行粗略介绍。

    97120编辑于 2022-06-23
  • 来自专栏【腾讯云开发者】

    从架构到代码:深入理解 OpenClaw 的双源记忆系统

    接下来,主要会针对 OpenClaw 的记忆系统进行分析,从架构设计和工程实现层面展示这个由 AI 自己创造的“大脑”。 03 记忆系统的存储架构 OpenClaw 的记忆系统采用了一个双源记忆架构的设计,其将记忆整体分为了两类:每日日志(动态记忆)和长期记忆(静态记忆)。 4.4 Agent 交互 基于上述介绍的记忆系统架构,在实际使用时,AI Agent 则是通过两个接口实现与整个记忆系统的交互。 ", // text (FTS5 自动分词) "a1b2c3d4e5f6... prompt: memoryFlushSettings.prompt, // ... }); } 5、 记忆检索结果 当 Agent 使用 memory_search 与记忆系统交互时,返回的结果也会加入上下文

    1K10编辑于 2026-03-27
  • 来自专栏CreateAMind

    意识的关键性:主动推理中兴奋-抑制平衡与双重记忆系统

    最近,一群神经科学家及相关学者联名请愿,要求宣布IIT不可证伪,因而属于非科学理论[4,5]。 图5为示意图,说明边缘调控如何与贝叶斯信念更新相结合。 如图5左侧所示,每个层级通过横向连接与其他通路的相同层级保持同步。每一个马尔可夫毯界定了在调节内脏、认知及感觉-运动主动推理过程中的经验与记忆的层级。 5. 此外,这些边缘控制完全依赖于其皮层下唤醒与激活控制,包括阶段性唤醒相关的脑桥lemnothalamic通路中的去甲肾上腺素(NE)和5-羟色胺(5HT)神经调质,以及持续性激活相关的中脑多巴胺(DA)和脚桥胆碱能

    19010编辑于 2026-03-11
  • 来自专栏决策智能与机器学习

    【重磅综述】记忆系统:神经科学的启示「AI核心算法」

    1 Introduction 记忆系统的研究开始于20世纪,并逐渐形成了古典主义记忆系统的认知,即 multiple memory systems theory (MMS) 。 此时,位于特定记忆系统之下的神经网络可以充当独立单元或更高阶 meta-network 的集成组件。这种动态网络模型提出了一种方法,可以将质疑不同记忆系统概念的实验证据纳入模块化记忆系统结构中。 3.2 Knowledge (representational) systems 记忆系统理论必须解决的问题是记忆系统的潜在无限增长。 3.4 Expanded parallel model of memory systems 制定该模型是为了解决以下事实:一个记忆系统获取的信息可以被另一个记忆系统利用。 在系统发育上,较新的记忆系统通过重新表征的过程集成了较旧的记忆系统生成的表征,即从较低级别表示的信息的高级抽象,从某种意义上说,记忆系统是按层次结构组织的。

    1.3K11发布于 2020-09-03
  • 来自专栏机器之心

    借鉴人脑「海马体-皮层」机制,红熊AI重做了一个「记忆系统

    具体来看,「记忆熊」的技术突破在于,它并不是对模型的记忆系统进行局部优化,而是「全链路重构」,借鉴了人脑「海马体 - 皮层」的分工协作机制,构建了一套分层、动态、可演进的「类人」记忆架构。 记忆熊」通过精准剔除冗余信息,在保持语义完整的前提下,能够实现 97% 的 token 效率提升和 82% 的语境偏移率降低,将复杂推理准确率提升至 75.00±0.20% 的行业高度,打破传统 AI 记忆系统

    33010编辑于 2025-12-24
  • Hermes Agent 三大核心能力详解:记忆系统、技能引擎与消息网关

    但如果要选出最能体现其差异化价值的三个能力,一定是:记忆系统——这是"越用越聪明"的基础技能引擎——这是"自我进化"的实现消息网关——这是"随时可达"的保障核心能力一:三层记忆架构第一层:短期工作记忆( 生命周期:永久保存存储方式:SQLite+FTS5全文检索作用:跨会话记住你的项目、偏好、习惯实际例子:展开代码语言:TXTAI代码解释你(第1天):"我的项目用的是Next.js14+TypeScript 生命周期:永久保存+持续迭代触发条件:复杂任务(5+次工具调用)完成后自动创建作用:将成功的工作流程封装为可复用技能记忆安全所有记忆条目在写入前都会经过安全扫描:检测Prompt注入模式识别敏感数据泄露风险过滤潜在的恶意指令核心能力二 :["部署Next.js","上线前端项目"]---##执行步骤1.检查Node.js版本(需要18+)2.Clone项目仓库3.安装依赖`npminstall`4.构建项目`npmrunbuild`5.

    43020编辑于 2026-04-15
  • 来自专栏程序那些事儿

    Khoj 不抢注意力,却接管了我对笔记的“记忆系统

    一开始,我其实并没有把 Khoj 当回事。在安装它之前,我已经用过太多“看起来很对”的 AI 工具了。

    17010编辑于 2026-01-27
  • 来自专栏CreateAMind

    意识的临界性:主动推理中兴奋–抑制平衡与双记忆系统

    最近,一组神经科学家及相关学者甚至联名请愿,要求宣布 IIT 不可证伪,因而不属于科学范畴[4,5]。 图5提供了一个示意图,说明边缘控制如何与贝叶斯信念更新相整合。 大脑内在的预测性“可供性”(affordances)由第5-6层锥体细胞投射至上层颗粒上层(更靠近感觉或运动区域的皮层较低层)提供,而外在的感觉证据进入第4层,提供校正性约束,以平衡感觉证据与先验约束的贡献 此外,这些边缘控制完全依赖于其皮层下唤醒与激活控制,包括桥脑NE和5HT神经调质对外侧丘脑的相位性唤醒,以及中脑DA和脚桥被盖胆碱能(PPT ACh)神经调质对内侧丘脑的持续性激活[73,75]。 睡眠中,通过抑制性神经生理机制(海马尖波涟漪、纺锤波和慢波振荡),继而在REM睡眠中通过兴奋性神经生理机制(在缺乏感觉-运动约束条件下,全局胆碱能兴奋性演练预测性先验),依次组织认知能力与现象体验(见表5

    13910编辑于 2026-03-11
  • 来自专栏openclaw系列

    OpenClaw记忆系统基石 —— memory-search.ts 中的 RAG 配置解析与合并逻辑

    OpenClaw 的记忆系统不仅支持长期会话回溯,还能接入企业知识库、个人笔记甚至实时文件,形成一个动态、可扩展的混合检索引擎。 一、记忆系统的三层数据源 OpenClaw 的 RAG 引擎可同时从以下来源检索信息: 所有数据在检索前被统一嵌入(embedding),存入 SQLite 向量数据库。 二、配置分层:四重覆盖机制 与全局配置类似,记忆系统也采用分层覆盖模型,优先级从低到高: 默认配置示例(L1) // src/agents/memory-search.ts const DEFAULT_MEMORY_CONFIG vectorWeight: 0.7, textWeight: 0.3, minSimilarity: 0.25, candidateMultiplier: 3, maxResults: 5, OpenClaw 采用加权混合检索(Hybrid Search): 向量检索:基于语义相似度(使用 ONNX / OpenAI / Gemini Embedding) 全文检索:基于关键词匹配(SQLite FTS5

    8.1K21编辑于 2026-03-14
领券