首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏数智转型架构师

    通俗讲解大模型短期记忆 vs 长期记忆

    有些同学问:智能体的 Memory 中 短期记忆(Short-term memory)与长期记忆(Long-term memory)是什么意思?有什么区别? 其中记忆包括短期记忆长期记忆。 短期记忆是智能体在单一会话中维护即时上下文的能力。 工作机制: 它完全依赖于大模型(LLM)的上下文窗口。 长期记忆允许智能体存储、检索和利用过去跨越数天、数月甚至数年的信息。 技术实现: 通常采用 检索增强生成(RAG) 技术。智能体将重要信息转化为向量(Embeddings)存入数据库。 拿 Cherry Studio 为例,长期记忆是通过“全局记忆”实现的。 你可以手动添加记忆,也可以在智能体里开启记忆。它就会把自己需要记忆的信息做判断,然后自动存储。 长期记忆则是通过持久化存储,如向量数据库实现的,可以跨对话。 如果文章对你有帮助,可以给我三连击:点赞、喜欢,并转发给身边需要的朋友。 希望本文分享的技巧对你有帮助,我们下次再见。

    1.3K10编辑于 2026-03-04
  • 来自专栏计算机工具

    长期记忆、短期记忆、遗忘机制及门控机制;

    长期记忆、短期记忆、遗忘机制及门控机制智能问答系统实现长期记忆、短期记忆、遗忘机制以及门控机制的方法如下: 长期记忆的实现- **使用数据库存储**:将大量的知识、信息和历史交互数据存储在数据库中。 这样系统可以通过遍历知识图谱来获取更全面和深入的知识,实现长期记忆。短期记忆的实现:滑动窗口- **使用缓存技术**:在系统内存中设置缓存,用于临时存储近期使用过的信息。 遗忘机制的实现- **设置时间阈值**:为存储的信息设置**时间戳**,当信息的存储时间超过一定阈值时,将其从缓存或长期记忆存储中删除。 对于长期记忆中的信息,如果长时间没有被使用,其活跃度较低,系统可以逐渐降低其权重或在存储空间紧张时将其删除。门控机制及其示例门控机制是一种在智能问答系统中用于控制信息流动和筛选的机制。 遗忘门决定了从过去的记忆中丢弃多少信息;输入门控制新的信息有多少可以进入记忆单元;输出门决定了当前的记忆状态有多少可以作为输出。

    76721编辑于 2025-01-18
  • 来自专栏AI大模型

    Spring AI 实战:聊天记忆之DB存储,长期记忆

    中配置 MySQL 连接信息和 JDBC 记忆参数; step 3:初始化记忆组件:绑定JdbcChatMemoryRepository 与 ChatMemory,配置双记忆类型; step 4:开发业务服务 spring.ai.zhipuai.base-url=https://open.bigmodel.cn/api/paas spring.ai.zhipuai.chat.options.model=GLM-4- (如 GLM-4、GPT 系列) */ @Bean public MessageChatMemoryAdvisor messageChatMemoryAdvisor(ChatMemory 行程按天/时段拆分,包含景点、交通、餐饮、实用提示(开放时间、预约要求),信息准确可执行; 4. , "memoryType": "prompt", "userId": "1001" } } 测试 4:清除记忆功能 访问接口(清除用户 1001 的 MySQL 记忆):http:

    49520编辑于 2026-03-31
  • 来自专栏程序员

    智能体(Agent)的记忆架构:深入解析短期记忆长期记忆

    新的会话将从零开始构建短期记忆,除非有意识地将上次会话的关键信息保存至长期记忆。第二章:长期记忆——智能体的知识库与经验库2.1定义与本质长期记忆是智能体在多次交互和会话之间持久化存储信息的系统。 2.2技术实现与工作机制长期记忆的实现不依赖于模型的上下文窗口,而是通过外部系统构建,主要涉及三个过程:存储存储什么:并非所有短期记忆中的信息都值得长期保存。 检索当新的会话开始时,Agent不会加载整个长期记忆库(那样会瞬间爆满短期记忆)。相反,它会根据当前的用户查询和短期记忆的上下文,去长期记忆库中寻找最相关的信息。 检索长期记忆:系统将当前查询与短期记忆的上下文结合,作为“检索键”,在长期记忆库中进行向量相似性搜索,找出相关记忆。 结论与展望短期记忆长期记忆是构成智能体认知架构的两大支柱。

    2.5K11编辑于 2025-09-25
  • 来自专栏AI人工智能

    智能体的记忆系统:短期记忆长期记忆与知识图谱

    智能体的记忆系统:短期记忆长期记忆与知识图谱 嗨,我是IRpickstars! 总有一行代码,能点亮万千星辰。 在技术的宇宙中,我愿做永不停歇的探索者。✨ 用代码丈量世界,用算法解码未来。 而具备记忆能力的智能体,能够记录和回忆过去的经验,从而在多轮对话、任务规划和长期交互中表现出更高的连贯性和智能性。智能体的记忆系统主要包括短期记忆长期记忆和知识图谱三个层次。 短期记忆用于存储当前会话或任务的上下文信息,长期记忆用于保存长期积累的知识和经验,而知识图谱则通过结构化的方式组织和表示知识实体及其关系。 长期记忆(Long-Term Memory, LTM):用于保存长期积累的知识和经验,生命周期较长。 长期记忆(LTM)长期记忆用于保存长期积累的知识和经验,生命周期较长。其实现方式包括:数据库存储:使用关系型或非关系型数据库存储知识信息。文件系统:将知识信息以文件的形式存储,支持持久化和版本控制。

    2K00编辑于 2025-07-14
  • 来自专栏AI SPPECH

    MCP 与长期记忆系统结合

    )的一个重要设计目标就是支持与长期记忆系统的深度集成,通过标准化的接口和协议,让 Agent 能够高效地存储、检索和利用长期记忆。 :.4f}") print() 运行结果: 记忆 1: 用户询问北京的天气情况,回复:晴天,20°C 相似度: 0.9234 相关性评分: 0.9567 记忆 2: 北京未来一周天气预报:以晴天为主 0.8234 记忆 4: 北京今天的空气质量指数:优,PM2.5 浓度 20μg/m³ 相似度: 0.7567 相关性评分: 0.7890 记忆 5: 北京旅游最佳季节:秋季(9-11月),天气凉爽 3.8.1 多记忆系统的集成方式 MCP v2.0 支持与多种记忆系统集成,主要包括: 向量数据库:如 Pinecone、Weaviate、Milvus 等,用于相似性检索 知识图谱:如 Neo4j、 " connection_string: "neo4j://localhost:7687" username: "neo4j" password: "password

    47310编辑于 2026-01-08
  • Agent记忆治理-从规则文件到长期记忆系统

    任务完成后,再把有长期价值的信息晋升到项目记忆里。多Agent协作的重点,不是让每个窗口都单独变聪明,而是让它们读取同一份可靠上下文。三、为什么Agent很难拥有长期记忆第三个问题是长期记忆。 我理解的Agent记忆至少可以分三层:短期记忆、项目记忆、全局长期记忆。短期记忆是当前会话状态,比如这个任务做到哪一步了。项目记忆是项目规则、架构、命令、踩坑记录。 全局长期记忆则是跨项目、跨工具的用户偏好、工作流和经验,比如我喜欢怎样的代码风格、部署时有哪些固定习惯、哪些服务器限制不能违反。很多方案会把长期记忆简单理解成“更长上下文”或“RAG”。 所以长期记忆的解决方向应该是:记忆分层,历史事件追加存储,重要信息可晋升,检索结果可解释、可溯源,敏感信息隔离存储。它更像工程资产管理,而不是聊天记录备份。 跨窗口记忆不同步,需要共享项目记忆和活跃任务索引。长期记忆缺失,需要分层记忆、可解释检索和晋升机制。规则文件仍然重要,但它只是入口。真正成熟的Agent使用方式,是把记忆当成工程资产来治理。

    10500编辑于 2026-06-04
  • 来自专栏AI SPPECH

    35:Multimodal Memory系统设计:短期记忆长期记忆、结构化+Graph记忆架构

    通过这种多模态记忆架构,显著提升AI系统的知识管理和推理能力。 目录 1. 本节为你提供的核心技术价值 2. 传统记忆系统的局限性 3. Multimodal Memory系统的核心优势 4. :基于记忆结构支持复杂推理 高效更新机制:支持记忆的动态更新和维护 多模态融合:实现不同模态信息的有效融合 4. 、长期记忆、结构化记忆和Graph记忆,构建完整的Multimodal Memory系统。 最佳实践与调优 9.1 最佳实践 记忆管理: 合理设置短期记忆容量,平衡内存使用和性能 定期将短期记忆中的重要信息转移到长期记忆 优化长期记忆的索引结构,提高检索速度 多模态处理: 选择合适的多模态模型 辅助:GitHub - chroma-core/chroma - 轻量级向量存储 辅助:GitHub - neo4j/neo4j - 图数据库 辅助:GitHub - openai/CLIP - 多模态模型

    36810编辑于 2026-04-05
  • 来自专栏AI SPPECH

    Memory System:短期、长期与永久记忆体系

    长期记忆:向量嵌入与语义检索 4.1 长期记忆的设计目标 4.2 嵌入向量生成 4.3 向量数据库选型与集成 4.4 长期记忆的更新与衰减机制 5. 三层记忆架构总览 本节为你提供的核心技术价值:掌握短期、长期、永久记忆的层次关系、数据特征与协作模式,理解"记忆金字塔"的设计哲学。 三层记忆之间存在明确的流动方向: 写入路径(Information Flow): 用户操作 → 短期记忆(实时捕获) 短期记忆长期记忆(会话结束时压缩写入) 长期记忆 → 永久记忆(提取高价值知识 4.1 长期记忆的设计目标 长期记忆(Long-Term Memory)是 AI IDE 的"经验库"。 4.2 嵌入向量生成 嵌入生成是长期记忆的入口。

    20610编辑于 2026-05-27
  • 状态空间模型为视频世界模型解锁长期记忆

    然而,一个重大瓶颈依然存在:长期记忆的维持。由于使用传统的注意力层处理长序列会产生高昂的计算成本,当前模型难以记住过去较远时间的事件和状态,这限制了它们执行需要持续理解复杂场景的任务的能力。 随着视频上下文的增长,注意力层所需的资源会爆炸式增长,使得长期记忆在实际应用中变得不切实际。 这种全局(状态空间模型)和局部(注意力)双重处理方法,使他们能够同时实现长期记忆和局部保真度。 研究人员在具有挑战性的数据集上评估了他们的长上下文状态空间视频世界模型,包括Memory Maze和Minecraft,这些数据集专门设计用于通过空间检索和推理任务来测试长期记忆能力。 实验表明,他们的方法在保持长期记忆方面显著超越了基线模型。

    22710编辑于 2026-03-17
  • 来自专栏新智元

    【Science】MIT研究长期记忆神经回路,海马体和新皮层记忆同时产生

    【新智元导读】MIT 4月6日在 Science 上发表的一篇论文对基于记忆过程的神经回路进行了研究,首次揭示出记忆在海马体和新(大脑)皮层中的长期储存是同时形成的,而在到达成熟状态之前,这一长期记忆会保持长达两周的 当我们拜访一个朋友或去海滩时,大脑会在一个叫做海马体的部分存储短期的记忆。一段名为海马脑部的经验的短暂记忆。这些记忆之后会被“巩固”——即转移到大脑的另一部分进行长期存储。 一项最新的针对基于这一过程的神经回路的MIT 研究首次揭示出,记忆是在海马体和大脑皮层中的长期储存区同时形成的。然而,在到达成熟状态之前,这一长期记忆会保持长达两周的“沉默”。 研究人员说,4月6日在 Science 发表的研究结果可能会使得关于记忆巩固如何发生的主要模式发生一些修正。 记忆长期存储 从20世纪50年代开始,对著名的遗忘症患者 Henry Molaison (当时只称为患者H.M.)的研究表明,海马体对于形成新的长期记忆至关重要。

    1.9K40发布于 2018-03-27
  • 来自专栏云云众生s

    向量数据库:人工智能的长期记忆

    向量数据库:人工智能的长期记忆 翻译自 Vector Databases: Long-Term Memory for Artificial Intelligence 。 人工智能(例如ChatGPT)的作用类似于具有固有记忆的人去图书馆阅读每一本书。然而,当你问一个 AI 一个不在图书馆书中的问题时,它要么承认自己不知道,要么产生幻觉。

    91110编辑于 2024-03-27
  • 来自专栏JS/TS

    Claude-Mem:给 AI 编程助手装上长期记忆

    这个痛点,Claude-Mem给出了解决方案——一个专为ClaudeCode打造的持久化记忆系统,让AI助手真正记住你们的每一次协作。 Claude-Mem通过自动捕获、AI压缩、智能检索三个步骤,实现了:✅**跨会话记忆保持:自动记录所有工具调用和代码操作✅**智能内容压缩:用ClaudeAgentSDK将冗长对话压缩成精炼摘要✅** 按需精准检索:通过自然语言查询历史记忆,大幅节省Token成本技术架构解析核心组件构成展开代码语言:TXTAI代码解释系统架构:├──钩子系统(7个生命周期钩子)├──Worker服务(HTTPAPI+ Claude:[自动触发mem-search]→检索到2条相关观察记录→返回:修改了auth.ts和session.middleware.ts场景二:项目知识库构建长期使用后,Claude-Mem会自动构建项目的 写在最后Claude-Mem不仅是一个工具,更是AI辅助编程的范式探索:如何让AI从"一次性对话"进化为"长期协作伙伴"。

    2K10编辑于 2026-01-26
  • 来自专栏腾讯云存储

    突破 AI 存储瓶颈,让智能体拥有长期记忆

    引言 2026年4月17日,以“智算筑基 生态共生”为主题的2026人工智能基础设施峰会在上海成功举行。 会上同期发布“2026人工智能基础设施风云榜”,腾讯云 Data Platform 凭借在 Agent 记忆管理方面的创新与实践,荣获「2026年度 AI 与数据平台奖」。 与传统 AI 不同,Agent AI 的多轮交互高度依赖历史信息、状态数据、轨迹日志与工具调用记录,Memory(记忆)已从偶发访问变为推理主路径。 随着交互持续积累,海量记忆数据对存储提出双重严苛要求:实时推理需低时延、高吞吐访问,长期记忆需海量容量、低成本存储。 Memory Lake 破局:打造智能体统一记忆中枢 针对行业痛点,腾讯云提出 Agent Memory Lake 理念,对标数据湖构建智能体统一记忆底座,贯穿 Agent 理解、推理、执行、反思全流程

    70510编辑于 2026-04-23
  • OpenHuman全面解析:长期记忆AI Agent的核心逻辑

    AI Agent”OpenHuman最大的特点:长期记忆系统在AI领域,“长期记忆”一直是非常难的问题。 因为传统大模型通常存在:上下文长度限制历史信息丢失长任务记忆混乱而 OpenHuman 的核心逻辑之一,就是尝试解决这些问题。它会通过:历史内容压缩分层记忆结构长期上下文整理让AI逐渐“理解用户”。 而 OpenHuman 的长期记忆体系,可以逐步建立:项目背景工作流程用户习惯任务关系从而让AI真正参与长期协作。OpenHuman为什么被称为AI Agent? 目前行业重点已经开始从:“AI能不能聊天”转向:“AI能不能长期帮人做事”而 OpenHuman 正好踩中了几个热门方向:长期记忆AI让AI不再“失忆”。 Agent自动化任务中枢而 OpenHuman 正在尝试把:长期记忆Agent执行工具协同本地AI整合到一起。

    32310编辑于 2026-05-22
  • 来自专栏运维有术

    OpenClaw Memory:让 AI Agent 拥有 7×24 小时的长期记忆

    而且不是模糊的"你之前问过 Redis",是精确到"4GB、缓存"这些细节。 这是怎么做到的?我翻了一遍 OpenClaw 的源码和文档,发现它的 Memory 机制设计得挺有意思。 1. 长期记忆:MEMORY.md 这个文件需要手动维护,用来存那些值得长期记住的东西——你的偏好、常用配置、重要决策。 有一个细节让我印象深刻:MEMORY.md只在私聊中加载,群聊不会读。 因为记忆里写的是"响应时间太慢",没有"性能"两个字。 混合搜索:找到了。向量搜索能理解"性能问题"和"响应时间太慢"是一回事。 这个组合确实比单一方案更靠谱。 4. 4. 如果你也在找一个有长期记忆的 AI Agent,不妨试试。

    1.4K00编辑于 2026-04-01
  • 来自专栏openclaw系列

    长期记忆与会话同步 —— 如何让OpenClaw记住跨天对话

    关键词:长期记忆|会话持久化|增量同步|上下文压缩|跨设备一致性 在传统聊天机器人中,对话一旦关闭,上下文即被遗忘。 OpenClaw 的目标是让 AI 智能体具备类人的记忆能力:不仅能记住单次对话,还能在跨天、跨设备、跨渠道的场景下保持上下文连贯。这依赖于一套精心设计的长期记忆与会话同步机制。 四、长期记忆注入:让历史对话参与 RAG 启用 sessionMemory.enabled: true 后,当前会话的历史消息会被自动纳入 RAG 检索源。 记忆不是回放,而是主动关联。 五、隐私与安全:记忆不是无限存储 长期记忆带来便利,也带来风险。OpenClaw 实施多重保护: 1. 用户可配置正则过滤器: sessionFilters: - pattern: "\\b[A-Za-z0-9]{30,}\\b" # 长字符串(疑似密钥) replace: "[REDACTED]" 4.

    2.7K22编辑于 2026-03-14
  • 来自专栏AI科技评论

    RNN和LSTM有长期记忆吗?并没有!| ICML 2020

    我们选择了一种简单直接的方式来定义多维时间序列的长期记忆,那就是检查时间序列的各个维度是否具有长期记忆,忽略不同维度之间的长期相关性。每个维度 都有一个记忆参数 来对该维度进行建模。 多维度时模型的简写见(4)式。 ARFIMA模型是本文的重要灵感来源之一。 4 长期记忆递归网格及其性质 根据上述理论成果,我们想对RNN和LSTM做出最小程度的修改,使其获得对长期相关性建模的能力。 Recurrent weighted average network (RWA); 4. MRNNF,即记忆参数 不随时间变化; 5. MRNN,即记忆参数 随时间变化; 6. 我们将100个随机数种子学出来的100个模型的表现画了boxplot,例子见图4。用两样本 -检验对比MRNN和RNN / LSTM的表现,结论显示MRNN的优势是显著的。

    2.8K41发布于 2020-06-30
  • 一位好莱坞女星,把 AI 长期记忆卷进了开源战场?

    一位好莱坞女星,把AI长期记忆卷进了开源战场?最近,MillaJovovich(米拉·乔沃维奇)和开发者联合发布了一个AI记忆系统,叫做MemPalace。 、可检索、可导航的长期记忆结构这也是它会突然爆起来的原因。 MemPalace到底在做什么README开头写得很直接:把所有对话原文保留下来不靠模型先决定“什么值得记住”再把这些原始内容做成可搜索、可导航的长期记忆结构这套方案借用了“记忆宫殿”的思路。 但一旦开始进入真实工作流,记忆就变成了地基。没有长期记忆,Agent只是在重复短期聪明。这个项目里可以先看这几件事先不急着下结论,这个项目里有几件事可以单独拿出来看。 所以今天再看MemPalace,更稳的角度是:它有没有把长期记忆系统里几件重要的事放在一起这套系统最值得看的三件事1.rawverbatimstorageREADME里写得很明确:原始对话原文直接存不先做总结抽取让语义检索去找相关内容这套思路和很多

    29410编辑于 2026-04-16
  • 谷歌Titans架构引入动态长期记忆机制

    最后,用 更新长期记忆:。 图3 Memory as a Layer (MAL): 将神经记忆模块作为网络层序列化堆叠(图4),先应用记忆模块压缩输入,再送入注意力层: 图4 Titans变体设计: 并行化实现: 为加速训练 训练与评估配置: 优化器:AdamW,学习率4e-4,余弦退火,权重衰减0.1,批次大小0.5MToken。 模型规模:170M、340M、400M、760M参数,公平比较相同参数量的基线。 结果:Titans-MAC在少样本下超越GPT-4等大型模型,微调后准确率超70B参数模型,证明其处理超长上下文的能力。 3.4 步骤4:效率与消融研究 记忆深度影响: 流程:变体 ,评估困惑度和吞吐量。 结果:深度增加提升性能,但线性降低吞吐量,例如 时吞吐量降至 的60%。

    23910编辑于 2026-04-09
领券