搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏数智转型架构师
通俗讲解大模型短期记忆 vs 长期记忆
有些同学问：智能体的 Memory 中短期记忆（Short-term memory）与长期记忆（Long-term memory）是什么意思？有什么区别？其中记忆包括短期记忆和长期记忆。短期记忆是智能体在单一会话中维护即时上下文的能力。工作机制：它完全依赖于大模型（LLM）的上下文窗口。长期记忆允许智能体存储、检索和利用过去跨越数天、数月甚至数年的信息。技术实现：通常采用检索增强生成（RAG）技术。智能体将重要信息转化为向量（Embeddings）存入数据库。拿 Cherry Studio 为例，长期记忆是通过“全局记忆”实现的。你可以手动添加记忆，也可以在智能体里开启记忆。它就会把自己需要记忆的信息做判断，然后自动存储。长期记忆则是通过持久化存储，如向量数据库实现的，可以跨对话。如果文章对你有帮助，可以给我三连击：点赞、喜欢，并转发给身边需要的朋友。希望本文分享的技巧对你有帮助，我们下次再见。
1.3K10编辑于 2026-03-04
来自专栏计算机工具
长期记忆、短期记忆、遗忘机制及门控机制；
长期记忆、短期记忆、遗忘机制及门控机制智能问答系统实现长期记忆、短期记忆、遗忘机制以及门控机制的方法如下：长期记忆的实现- **使用数据库存储**：将大量的知识、信息和历史交互数据存储在数据库中。这样系统可以通过遍历知识图谱来获取更全面和深入的知识，实现长期记忆。短期记忆的实现：滑动窗口- **使用缓存技术**：在系统内存中设置缓存，用于临时存储近期使用过的信息。遗忘机制的实现- **设置时间阈值**：为存储的信息设置**时间戳**，当信息的存储时间超过一定阈值时，将其从缓存或长期记忆存储中删除。例如，对于缓存中的短期记忆信息**，如果在10分钟内没有被再次访问，就将其删除。**- **基于活跃度的遗忘**：根据信息的使用频率来决定是否遗忘。对于长期记忆中的信息，如果长时间没有被使用，其活跃度较低，系统可以逐渐降低其权重或在存储空间紧张时将其删除。门控机制及其示例门控机制是一种在智能问答系统中用于控制信息流动和筛选的机制。
76721编辑于 2025-01-18
来自专栏AI大模型
Spring AI 实战：聊天记忆之DB存储，长期记忆
\n\n### 第二天\n\n**上午**\n- **8:00-10:00** 乘坐地铁2号线至【胡里山站】出口，游览【胡里山炮台】。 \n- **10:00-12:00** 乘坐地铁2号线至【海沧大桥站】出口，前往【环岛路】，骑行或步行欣赏海滨风光。 \n\n### 第二天：泉州自然风光游\n\n**上午**\n- **8:00-10:00** 乘坐网约车前往【清源山】。\n- **10:00-12:00** 游览清源山，参观【老君岩】等自然景观。 \n\n### 第三天：泉州文化体验游\n\n**上午**\n- **8:00-10:00** 乘坐网约车前往【泉州海外交通史博物馆】。 \n\n### 第二天：漳州自然风光游\n\n**上午**\n- **8:00-10:00** 乘坐网约车前往【火山岛国家地质公园】。
49520编辑于 2026-03-31
来自专栏程序员
智能体（Agent）的记忆架构：深入解析短期记忆与长期记忆
新的会话将从零开始构建短期记忆，除非有意识地将上次会话的关键信息保存至长期记忆。第二章：长期记忆——智能体的知识库与经验库2.1定义与本质长期记忆是智能体在多次交互和会话之间持久化存储信息的系统。 2.2技术实现与工作机制长期记忆的实现不依赖于模型的上下文窗口，而是通过外部系统构建，主要涉及三个过程：存储存储什么：并非所有短期记忆中的信息都值得长期保存。检索当新的会话开始时，Agent不会加载整个长期记忆库（那样会瞬间爆满短期记忆）。相反，它会根据当前的用户查询和短期记忆的上下文，去长期记忆库中寻找最相关的信息。检索长期记忆：系统将当前查询与短期记忆的上下文结合，作为“检索键”，在长期记忆库中进行向量相似性搜索，找出相关记忆。结论与展望短期记忆和长期记忆是构成智能体认知架构的两大支柱。
2.5K11编辑于 2025-09-25
来自专栏AI人工智能
智能体的记忆系统：短期记忆、长期记忆与知识图谱
智能体的记忆系统：短期记忆、长期记忆与知识图谱嗨，我是IRpickstars！总有一行代码，能点亮万千星辰。在技术的宇宙中，我愿做永不停歇的探索者。✨ 用代码丈量世界，用算法解码未来。而具备记忆能力的智能体，能够记录和回忆过去的经验，从而在多轮对话、任务规划和长期交互中表现出更高的连贯性和智能性。智能体的记忆系统主要包括短期记忆、长期记忆和知识图谱三个层次。短期记忆用于存储当前会话或任务的上下文信息，长期记忆用于保存长期积累的知识和经验，而知识图谱则通过结构化的方式组织和表示知识实体及其关系。长期记忆（Long-Term Memory, LTM）：用于保存长期积累的知识和经验，生命周期较长。长期记忆（LTM）长期记忆用于保存长期积累的知识和经验，生命周期较长。其实现方式包括：数据库存储：使用关系型或非关系型数据库存储知识信息。文件系统：将知识信息以文件的形式存储，支持持久化和版本控制。
2K00编辑于 2025-07-14
来自专栏AI SPPECH
MCP 与长期记忆系统结合
）的一个重要设计目标就是支持与长期记忆系统的深度集成，通过标准化的接口和协议，让 Agent 能够高效地存储、检索和利用长期记忆。 1.2 长期记忆集成的核心挑战将长期记忆系统与 Agent 集成面临着诸多挑战：记忆存储与检索效率：如何高效地存储和检索大量的记忆数据记忆的关联性与结构化：如何将非结构化的记忆转化为结构化的知识 "key2": "value2" } }, "embedding": [0.1, 0.2, 0.3, ...], "created_at": "2026-01-01T10 1KB 测试结果如下：操作类型平均响应时间吞吐量（每秒操作数）记忆存储 120ms 8,333 记忆检索（10条结果） 80ms 12,500 记忆更新 150ms 6,666 记忆删除 50ms 支持复杂任务：长期记忆支持 Agent 处理复杂的多步任务和长期项目促进知识共享：不同 Agent 之间可以共享记忆资源，促进知识的传播和复用 5.2 潜在风险尽管 MCP 与长期记忆系统的结合具有诸多优势
47310编辑于 2026-01-08
Agent记忆治理-从规则文件到长期的记忆系统
任务完成后，再把有长期价值的信息晋升到项目记忆里。多Agent协作的重点，不是让每个窗口都单独变聪明，而是让它们读取同一份可靠上下文。三、为什么Agent很难拥有长期记忆第三个问题是长期记忆。我理解的Agent记忆至少可以分三层：短期记忆、项目记忆、全局长期记忆。短期记忆是当前会话状态，比如这个任务做到哪一步了。项目记忆是项目规则、架构、命令、踩坑记录。全局长期记忆则是跨项目、跨工具的用户偏好、工作流和经验，比如我喜欢怎样的代码风格、部署时有哪些固定习惯、哪些服务器限制不能违反。很多方案会把长期记忆简单理解成“更长上下文”或“RAG”。所以长期记忆的解决方向应该是：记忆分层，历史事件追加存储，重要信息可晋升，检索结果可解释、可溯源，敏感信息隔离存储。它更像工程资产管理，而不是聊天记录备份。跨窗口记忆不同步，需要共享项目记忆和活跃任务索引。长期记忆缺失，需要分层记忆、可解释检索和晋升机制。规则文件仍然重要，但它只是入口。真正成熟的Agent使用方式，是把记忆当成工程资产来治理。
10400编辑于 2026-06-04
来自专栏AI SPPECH
35：Multimodal Memory系统设计：短期记忆、长期记忆、结构化+Graph记忆架构
核心技术架构 4.1 系统架构 4.2 核心组件组件功能作用数据预处理处理多模态输入数据标准化和特征提取短期记忆存储近期和临时信息快速访问和处理长期记忆存储长期和重要信息持久化存储和检索 """获取短期记忆大小""" return len(self.memory) # 示例使用 stm = ShortTermMemory(capacity=10) stm.add 、长期记忆、结构化记忆和Graph记忆，构建完整的Multimodal Memory系统。传统记忆系统 10,000 1.0 75% 低弱单模态记忆系统 100,000 0.5 80% 无中 Multimodal Memory系统 1,000,000 0.3 92% 高强 6.3 最佳实践与调优 9.1 最佳实践记忆管理：合理设置短期记忆容量，平衡内存使用和性能定期将短期记忆中的重要信息转移到长期记忆优化长期记忆的索引结构，提高检索速度多模态处理：选择合适的多模态模型
36810编辑于 2026-04-05
来自专栏AI SPPECH
Memory System：短期、长期与永久记忆体系
长期记忆：向量嵌入与语义检索 4.1 长期记忆的设计目标 4.2 嵌入向量生成 4.3 向量数据库选型与集成 4.4 长期记忆的更新与衰减机制 5. 三层记忆架构总览本节为你提供的核心技术价值：掌握短期、长期、永久记忆的层次关系、数据特征与协作模式，理解"记忆金字塔"的设计哲学。）长期记忆 → 永久记忆（提取高价值知识）外部知识 → 永久记忆（项目文档解析）读取路径（Retrieval Flow）：用户查询 → 短期记忆（精确匹配）用户查询 → 长期记忆（语义检索） 4.1 长期记忆的设计目标长期记忆（Long-Term Memory）是 AI IDE 的"经验库"。 4.2 嵌入向量生成嵌入生成是长期记忆的入口。
20610编辑于 2026-05-27
状态空间模型为视频世界模型解锁长期记忆
然而，一个重大瓶颈依然存在：长期记忆的维持。由于使用传统的注意力层处理长序列会产生高昂的计算成本，当前模型难以记住过去较远时间的事件和状态，这限制了它们执行需要持续理解复杂场景的任务的能力。随着视频上下文的增长，注意力层所需的资源会爆炸式增长，使得长期记忆在实际应用中变得不切实际。这种全局（状态空间模型）和局部（注意力）双重处理方法，使他们能够同时实现长期记忆和局部保真度。通过将帧分组（例如，每组5帧，帧窗口大小为10），组内的帧保持双向性，同时也能关注前一组中的帧。这在优化计算负载的同时，实现了有效的感受野。实验表明，他们的方法在保持长期记忆方面显著超越了基线模型。
22710编辑于 2026-03-17
来自专栏新智元
【Science】MIT研究长期记忆神经回路，海马体和新皮层记忆同时产生
【新智元导读】MIT 4月6日在 Science 上发表的一篇论文对基于记忆过程的神经回路进行了研究，首次揭示出记忆在海马体和新（大脑）皮层中的长期储存是同时形成的，而在到达成熟状态之前，这一长期记忆会保持长达两周的当我们拜访一个朋友或去海滩时，大脑会在一个叫做海马体的部分存储短期的记忆。一段名为海马脑部的经验的短暂记忆。这些记忆之后会被“巩固”——即转移到大脑的另一部分进行长期存储。一项最新的针对基于这一过程的神经回路的MIT 研究首次揭示出，记忆是在海马体和大脑皮层中的长期储存区同时形成的。然而，在到达成熟状态之前，这一长期记忆会保持长达两周的“沉默”。记忆的长期存储从20世纪50年代开始，对著名的遗忘症患者 Henry Molaison （当时只称为患者H.M.）的研究表明，海马体对于形成新的长期记忆至关重要。 Molaison 在控制癫痫发作的手术期间损伤了海马体，术后无法再存储新的记忆。然而，他仍然可以回忆起手术前的一些事情。这表明长期的情景记忆（特定事件的记忆）被存储在海马体外。
1.9K40发布于 2018-03-27
来自专栏云云众生s
向量数据库：人工智能的长期记忆
向量数据库：人工智能的长期记忆翻译自 Vector Databases: Long-Term Memory for Artificial Intelligence 。人工智能（例如ChatGPT）的作用类似于具有固有记忆的人去图书馆阅读每一本书。然而，当你问一个 AI 一个不在图书馆书中的问题时，它要么承认自己不知道，要么产生幻觉。
91110编辑于 2024-03-27
来自专栏JS/TS
Claude-Mem：给 AI 编程助手装上长期记忆
这个痛点，Claude-Mem给出了解决方案——一个专为ClaudeCode打造的持久化记忆系统，让AI助手真正记住你们的每一次协作。 Claude-Mem通过自动捕获、AI压缩、智能检索三个步骤，实现了：✅**跨会话记忆保持：自动记录所有工具调用和代码操作✅**智能内容压缩：用ClaudeAgentSDK将冗长对话压缩成精炼摘要✅** Claude：[自动触发mem-search]→检索到2条相关观察记录→返回：修改了auth.ts和session.middleware.ts场景二：项目知识库构建长期使用后，Claude-Mem会自动构建项目的新特性）<private>：完全排除观察记录<no-summary>：记录但不生成摘要性能表现数据优化指标实际效果Token节省每次启动节省2,250tokens查询响应速度向量检索<50ms存储压缩效率10GB 写在最后Claude-Mem不仅是一个工具，更是AI辅助编程的范式探索：如何让AI从"一次性对话"进化为"长期协作伙伴"。
2K10编辑于 2026-01-26
来自专栏腾讯云存储
突破 AI 存储瓶颈，让智能体拥有长期记忆！
腾讯云存储专家架构师王登宇结合腾讯云服务海量企业的实践洞察，深度解读 Agent AI 带来的存储变革与技术挑战，带来腾讯云存储 Agent Memory Lake（智能体记忆湖）理念。会上同期发布“2026人工智能基础设施风云榜”，腾讯云 Data Platform 凭借在 Agent 记忆管理方面的创新与实践，荣获「2026年度 AI 与数据平台奖」。与传统 AI 不同，Agent AI 的多轮交互高度依赖历史信息、状态数据、轨迹日志与工具调用记录，Memory（记忆）已从偶发访问变为推理主路径。随着交互持续积累，海量记忆数据对存储提出双重严苛要求：实时推理需低时延、高吞吐访问，长期记忆需海量容量、低成本存储。 Memory Lake 破局：打造智能体统一记忆中枢针对行业痛点，腾讯云提出 Agent Memory Lake 理念，对标数据湖构建智能体统一记忆底座，贯穿 Agent 理解、推理、执行、反思全流程
70510编辑于 2026-04-23
OpenHuman全面解析：长期记忆AI Agent的核心逻辑
AI Agent”OpenHuman最大的特点：长期记忆系统在AI领域，“长期记忆”一直是非常难的问题。因为传统大模型通常存在：上下文长度限制历史信息丢失长任务记忆混乱而 OpenHuman 的核心逻辑之一，就是尝试解决这些问题。它会通过：历史内容压缩分层记忆结构长期上下文整理让AI逐渐“理解用户”。而 OpenHuman 的长期记忆体系，可以逐步建立：项目背景工作流程用户习惯任务关系从而让AI真正参与长期协作。OpenHuman为什么被称为AI Agent？目前行业重点已经开始从：“AI能不能聊天”转向：“AI能不能长期帮人做事”而 OpenHuman 正好踩中了几个热门方向：长期记忆AI让AI不再“失忆”。 --br {mso-data-placement:same-cell;}--> td {white-space:nowrap;border:0.5pt solid #dee0e3;font-size:10pt
32310编辑于 2026-05-22
来自专栏运维有术
OpenClaw Memory：让 AI Agent 拥有 7×24 小时的长期记忆
长期记忆：MEMORY.md 这个文件需要手动维护，用来存那些值得长期记住的东西——你的偏好、常用配置、重要决策。有一个细节让我印象深刻：MEMORY.md只在私聊中加载，群聊不会读。我搜索"数据库优化"，以前返回的 10 条结果有 8 条都在讲索引——同一个角度重复了。MMR 会刻意打散，让结果涵盖索引、连接池、查询重写等不同方向。 "5m", debounceMs: 15000, onBoot: true }, limits: { maxResults: 10 10. 几个实用小技巧 1. 如果你也在找一个有长期记忆的 AI Agent，不妨试试。
1.4K00编辑于 2026-04-01
来自专栏openclaw系列
长期记忆与会话同步 —— 如何让OpenClaw记住跨天对话
关键词：长期记忆｜会话持久化｜增量同步｜上下文压缩｜跨设备一致性在传统聊天机器人中，对话一旦关闭，上下文即被遗忘。 OpenClaw 的目标是让 AI 智能体具备类人的记忆能力：不仅能记住单次对话，还能在跨天、跨设备、跨渠道的场景下保持上下文连贯。这依赖于一套精心设计的长期记忆与会话同步机制。 // 消息历史（含 AI 思考、工具调用） lastAccessed: number; // 最后活跃时间戳 memoryEnabled: boolean; // 是否启用长期记忆四、长期记忆注入：让历史对话参与 RAG 启用 sessionMemory.enabled: true 后，当前会话的历史消息会被自动纳入 RAG 检索源。记忆不是回放，而是主动关联。五、隐私与安全：记忆不是无限存储长期记忆带来便利，也带来风险。OpenClaw 实施多重保护： 1.
2.7K22编辑于 2026-03-14
来自专栏AI科技评论
RNN和LSTM有长期记忆吗？并没有！| ICML 2020
那么如果不可和，则具有长期记忆；如果可和，则具有短期记忆。除了自协方差函数之外，还可以等价地用谱密度函数来定义长期或短期记忆。更严谨的表述见下图中定义一。我们选择了一种简单直接的方式来定义多维时间序列的长期记忆，那就是检查时间序列的各个维度是否具有长期记忆，忽略不同维度之间的长期相关性。每个维度都有一个记忆参数来对该维度进行建模。外部变量若本身就带有长期记忆性质，会干扰我们对于神经网络记忆性质的分析，所以有外部变量时无法使用现有的统计学上对于长期记忆性质的定义。长期记忆滤波器的具体形式为 MRNN网络结构的图例为其中长期记忆隐层单元是与普通隐层单元并列运作的新隐层单元，负责捕捉长期记忆的信息，而负责对短期的信息进行建模。那么门不随时间变化的LSTM不具备长期记忆，而门不随时间变化的MLSTM（简称MLSTMF）具有长期记忆。
2.8K41发布于 2020-06-30
一位好莱坞女星，把 AI 长期记忆卷进了开源战场？
一位好莱坞女星，把AI长期记忆卷进了开源战场？最近，MillaJovovich（米拉·乔沃维奇）和开发者联合发布了一个AI记忆系统，叫做MemPalace。、可检索、可导航的长期记忆结构这也是它会突然爆起来的原因。 MemPalace到底在做什么README开头写得很直接：把所有对话原文保留下来不靠模型先决定“什么值得记住”再把这些原始内容做成可搜索、可导航的长期记忆结构这套方案借用了“记忆宫殿”的思路。但一旦开始进入真实工作流，记忆就变成了地基。没有长期记忆，Agent只是在重复短期聪明。这个项目里可以先看这几件事先不急着下结论，这个项目里有几件事可以单独拿出来看。所以今天再看MemPalace，更稳的角度是：它有没有把长期记忆系统里几件重要的事放在一起这套系统最值得看的三件事1.rawverbatimstorageREADME里写得很明确：原始对话原文直接存不先做总结抽取让语义检索去找相关内容这套思路和很多
29410编辑于 2026-04-16
谷歌Titans架构引入动态长期记忆机制
贡献三：大规模实验验证——在语言建模（困惑度降低约10%）、常识推理（准确率提升约5%）、长上下文任务（如2MToken的“大海捞针”任务）中均优于基线，并证明了其在时间序列预测和DNA建模中的泛化能力相关背景与整体框架前提假设：序列数据的建模需要平衡局部依赖（短期记忆）和全局历史（长期记忆）。记忆检索：对于查询，通过前向传播（无权重更新）获取输出：此步骤允许模型从长期记忆中提取相关信息，而不改变记忆状态。最后，用更新长期记忆：。分析：神经记忆模块（LMM）单独使用已超越多数基线，显示长期记忆的有效性；结合注意力后（MAC/MAG）进一步优化。
23910编辑于 2026-04-09

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

通俗讲解大模型短期记忆 vs 长期记忆

长期记忆、短期记忆、遗忘机制及门控机制；

Spring AI 实战：聊天记忆之DB存储，长期记忆

智能体（Agent）的记忆架构：深入解析短期记忆与长期记忆

智能体的记忆系统：短期记忆、长期记忆与知识图谱

MCP 与长期记忆系统结合

Agent记忆治理-从规则文件到长期的记忆系统

35：Multimodal Memory系统设计：短期记忆、长期记忆、结构化+Graph记忆架构

Memory System：短期、长期与永久记忆体系

状态空间模型为视频世界模型解锁长期记忆

【Science】MIT研究长期记忆神经回路，海马体和新皮层记忆同时产生

向量数据库：人工智能的长期记忆

Claude-Mem：给 AI 编程助手装上长期记忆

突破 AI 存储瓶颈，让智能体拥有长期记忆！

OpenHuman全面解析：长期记忆AI Agent的核心逻辑

OpenClaw Memory：让 AI Agent 拥有 7×24 小时的长期记忆

长期记忆与会话同步 —— 如何让OpenClaw记住跨天对话

RNN和LSTM有长期记忆吗？并没有！| ICML 2020

一位好莱坞女星，把 AI 长期记忆卷进了开源战场？

谷歌Titans架构引入动态长期记忆机制

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐