我从AIP平台架构设计Agent产品经验软件架构师罗小东,多年架构和平台产品设计经验,目前在Agent场景落地结合中。 这里的经验更多偏向于架构设计与工程实践,每个架构师有自己的思路,我有我思。前期的时候,也是考虑了很久,觉得企业级AI智能体平台在架构设计上相对来说是会有些不一样的。 这里要说说我们在知识库管理方面的一些经验。多源数据整合的技术难点前期的时候,知识库都是单一数据源的,比如只支持PDF或者只支持数据库。 这里要说说我们在可视化编排方面的一些经验。拖拽式界面的设计逻辑前期的时候,工作流配置都是代码式的,需要写JSON或者YAML配置文件。但是随着用户群体的扩大,我们发现这种方式门槛太高了。 每个产品设计思路不一,这个是建设企业级AI智能体平台的一些经验,期望给有兴趣的朋友参考,也欢迎交流。
TOC高可用架构和系统设计经验图片本文从研发规范层面、应用服务层面、存储层面、产品层面、运维部署层面、异常应急层面这六大层面去剖析一个高可用的系统需要有哪些关键的设计和考虑一、高可用架构和系统设计思想可用性和高可用概念可用性是一个可以量化的指标 高可用系统设计思想高可用系统的设计,需要有一套比较科学的工程管理套路,要从产品、开发、运维、基建等全方位去考量和设计,高可用系统的设计思想包括但不限于:做好研发规范,系统都是研发人员设计和编码写出来的, 容量规划阶段,更多是要依靠自身和团队的经验,比如要了解我们的 log 的性能、redis 的性能、rpc 接口的性能、服务化框架的性能等等,然后根据各种组件的性能来综合评估自己设计的系统的整体性能情况。 3,主从切换主备复制和主从复制方案存在两个共性的问题:主机故障后,无法进行写操作。如果主机无法恢复,需要人工指定新的主机角色。 推荐阅读推荐阅读我的其他文章:《高并发架构和系统设计经验》《TCP 长连接层的设计和 在 IM 项目中实战应用》《万字解读云原生时代,如何从 0 到 1 构建 K8s 容器平台的 LB(Nginx)负载均衡体系
现代 Agent 框架在设计时已充分考虑异步操作,使您能够轻松定义可并行运行的步骤。 图 1. ADK 框架的这一固有能力使开发人员能够设计并实现多个 Agent 并发而非顺序操作的解决方案。 系统设置了三个 LlmAgent 实例作为专门的研究员:ResearcherAgent1 专注于可再生能源,ResearcherAgent2 研究电动汽车技术,ResearcherAgent3 调查碳捕获方法 经验法则: 当工作流包含多个可同时运行的独立操作时使用此模式,例如从多个 API 获取数据、处理不同数据块或生成多个内容片段供后续综合。 ,影响设计、调试和系统日志等关键开发环节 像 LangChain 和 Google ADK 这样的框架提供定义和管理并行执行的内置支持 在 LangChain 表达式语言(LCEL)中,RunnableParallel
这是"Agent设计模式"系列文章的最后一篇。 可扩展:新增功能只需添加新Agent 二、Agent角色设计:职责分离 Multi-Agent系统的第一步是角色定义。 每个Agent必须明确: 它负责什么 它的输入是什么 它的输出是什么 它和其他Agent如何交互 ▪ 代码审查系统的角色设计 # agent_roles.py from dataclasses import 已停止 ✓ Agent summarizer 已停止 ✓ 系统已关闭 六、系列总结与学习路线 ▪ 6.1 六篇文章回顾 这个系列我们完整覆盖了Agent设计的核心模式: 文章 模式 核心思想 适用场景 在单Agent能解决问题时,不要为了"炫技"而使用Multi-Agent。系统的价值在于解决问题,而不是技术有多复杂。 这个系列到这里就结束了。 希望这几篇文章能给你一个清晰的Agent设计地图。
用户与Agent的多轮对话过程中会出现很多记忆,包括用户原始的意图、诉求、关键词,还包括Agent的推理、规划、工具调用的执行结果及模型最终的响应。 智能体毕竟是一个软件系统,所以越来越多人用软件设计的思想实现[记忆模块]。 我们将智能体类比于一台计算机,文件系统就是计算机的记忆模块。 如果哪天底层切换存储组件,Agent层完全不需要感知,切换很灵活。 因为在接口层面做了抽象,所以可以很好的面向功能进行接口涉及,而无需关注这个功能接口究竟是用了一个文件系统还是多个类型的文件系统。 回过头来,我们看一下从用户提出问题,到最终Agent给出回答的整个流程如下。 最终实现类似于操作系统的文件系统能力,让智能体的记忆可追溯(每一步有据可查)、可审计(所有操作都有日志)、可演化(新组件无缝接入),整个Agent的记忆历史都是可以回溯的,而不是黑盒了。
@ Google》,透露了Colossus设计的深层思考。 Colossus汲取了GFS的经验教训,正如在《Storage Architecture and Challenge》中所提及的GFS的不足。 基础知识: 谷歌的第一个集群级文件系统(2001) 为具有大文件的批处理应用程序设计 同时管理metadata和chunk的单一主程序 为了可靠性,chunk通常被复制3份 GFS教训: 扩展到大约50M Colossus简史 2001年,谷歌设计第一个集群文件系统——GFS。GFS支持P级的数据存储,以及数千客户机与数千服务器的交互。 谷歌需要将系统迁移到集群级的文件系统,该文件系统具有容错能力,设计用于大规模扩展,能够更有效地使用机器资源,并且对面向用户的服务提供最小的干扰。
介绍完OS整体架构之后,我们会进一步介绍OS中的几个关键设计(双核通信,UI框架等)以及典型功耗问题的解决思路和方法(实战经验)。 3.双核通信的设计方案 1)双核通信的硬件架构 双核通信的硬件架构可以简单用下图来表示: ? 核心方法就是通过针对性的测试以及相关的摘件实验来缩小范围,然后通过软硬件的设计、代码与电路的走查等方式抓住根本原因。下面是一些典型问题的经验总结。 除了常规的硬件器件选型和硬件设计之外,本文总结的经验如下: 1.CPU选取需要尽可能平衡好功耗与算力的关系 2.双核架构需要引入,充分利用小核做更多算法与缓存工作,也有利于解耦 3.通过自研OS,可以将算力和 1.张巨广 腾讯车联网系统架构师,真时科技操作系统研发负责人 2.秦耕 真时科技操作系统研发负责人,腾讯操作系统研发高级工程师 3.马伟富 真时科技驱动软件高级工程师,TCL驱动软件高级工程师 4.张一凡
秒杀无外乎解决两个核心问题,一是并发读,一是并发写,对应到架构设计,就是高可用、一致性和高性能的要求。 关于秒杀系统的设计思考,本文即基于此 3 层依次推进,简述如下: 高性能。 如何保障应用在复杂工况环境下还能高效稳定运行,如何预防和面对突发问题,系统设计时应该从哪些方面着手? 这是因为一般都会对大流量的秒杀系统做系统的静态化改造,即数据意义上的动静分离。动静分离三步走:1、数据拆分;2、静态缓存;3、数据整合。 采集访问URL或 Agent 采集热点日志(一些中间件本身已具备热点发现能力),提前识别潜在的热点数据 聚合分析热点数据,达到一定规则的热点数据,通过订阅分发推送到链路系统,各系统根据自身需求决定如何处理热点数据 尤其在秒杀这一场景下,为了保证系统的高可用,必须设计一个 Plan B 方案来进行兜底。 高可用建设,其实是一个系统工程,贯穿在系统建设的整个生命周期。 ?
MOOON-agent系统设计与使用说明.pdf MOOON-agent系统设计与使用说明 易剑 2012/6/16 1. 设计目标 一个通用的agent框架,提供编程接口,并内置通用的功能。 2. 应用场景 ? 3. 系统骨架 ? 5. 资源接口 暂略。 6. 内置CommandProcessor 暂略。 7. 编程接口 除宏外,所以内容均位于agent名字空间内。 (&_command_processor3); _agent->set_center(ArgsParser::center_ip->get_value(), ; CCommandProcessor3 _command_processor3; }; // 入口函数 extern "C" int main(int argc, char* argv[]) {
本框架致力于在人类领导与底层模型原始能力间建立最纯净对话通道,确保每个 Agent 均以峰值潜力运行。 该框架构建为专业化 Agent 团队,每个 Agent 针对开发生命周期中的核心功能专门设计。 核心组件架构 为高效运用前沿大语言模型,本框架将不同开发角色分配给专业化 Agent 团队。这些 Agent 并非独立应用,而是通过精心设计的角色特定提示与上下文在 LLM 中调用的概念化人格。 流程编排者:人类开发者: 在此协作框架中,人类开发者承担编排者职能,作为 AI Agent 的中央智能节点与最终权威。 角色定位: 团队领导、系统架构师及最终决策者。 明确界定"目标愿景"与"设计 rationale",借助 Agent 团队加速"实施方案"落地。作为设计决策的最终仲裁者,确保各组件严格遵循项目长期愿景与质量标准。 通过将战术执行委派予 Agent,开发者得以将认知资源聚焦于真正核心领域:战略创新、韧性架构设计,以及打造用户惊喜产品所需的创造性问题破解。
就2024年的今天,可见的模式主要包含3种:Single Agent、Multi-Agents、Human-Agent。 那么,我们应该如何来设计一套系统,实现这样的诉求呢? Agent功能分类 我们按照最小职责原则,将所有的功能进行划分,尽可能的把功能拆分开,每一个功能,都有一个Agent与之对应。 AI系统设计示意图(注意,这里的中枢层和Agent的中枢大脑是两个概念) 对于我们开发者,主要是在软件侧做一些事情,不同的硬件传感器它的数据结构是不同的,因此,我们需要有一个针对性的agent来处理这类传感器的信号 AI应用设计示意图 通过这一架构,我们可以让Agent被无限扩展,而无需调整已有代码。随着agents的数量越来越多,系统能支持的能力也越来越强。 我们只需要利用这些agents来进行调用编排,即可实现让系统按需完成我们的任务,例如: 当 @agent1 发生xx时,且 @agent2 状态为xx时,@agent3 执行xxx 基于该指令,平台层可以基于已有的
虽然每种模式都针对特定的设计挑战,但可以通过将它们归类到反映智能 Agent 核心能力的基础类别中来整体理解它们。 核心执行和任务分解: 在最基本的层面上,Agent 必须能够执行任务。 学习和适应模式更进一步,允许 Agent 的行为根据反馈和经验而演变,使其随时间变得更加有效。 协作和通信: 许多复杂问题最好通过协作来解决。 多 Agent 协作模式允许创建系统,其中多个专门的 Agent(每个都有不同的角色和能力集)共同努力实现共同目标。这种劳动分工使系统能够处理对单个 Agent 来说难以解决的多方面问题。 为复杂系统组合模式 Agentic 设计的真正力量不是来自孤立地应用单一模式,而是来自巧妙地组合多种模式以创建复杂的多层系统。 这些 Agentic 设计模式是您的调色板和笔触——使您能够超越简单的提示词并创建动态的、响应式的和目标导向的实体的基础元素。
情感: 理解何时应用 zero-shot、one-shot 和 few-shot 提示技术,并精心设计和组织示例,对于提升 Agentic 系统的效能至关重要。 例如,一个经过上下文工程设计的 Agent 在响应查询前,会整合用户的日历可用性(工具输出)、与邮件收件人的专业关系(隐式数据)以及过往会议记录(检索文档)。 和为 x + (x+1) + (x+2) = 3x + 3。已知和为 36,所以 3x + 3 = 36。两边减去 3:3x = 33。除以 3:x = 11。 这些技术对于构建能够主动与世界互动、检索实时信息并执行需要与外部系统交互任务的 Agent 至关重要。 底层模型设计为在整个对话过程中始终遵循这些预定义指令。 这允许为专注应用创建高度专业化的 AI Agent。例如,可配置 Gem 作为仅引用特定编程库的代码解释器。
多Agent视角下的自动驾驶系统设计:车端Agent与RSUAgent协同机制解析一、引言:为什么自动驾驶需要协作式Agent在传统自动驾驶系统中,车辆往往被设计为高度自治的单体智能体:依赖车载传感器( 2.异步与不可靠通信假设系统必须假设:通信存在延迟信息可能丢失车端需具备独立决策能力3.可扩展的协作策略后续可引入:多Agent强化学习(MARL)博弈论冲突消解基于意图的协同规划(IntentSharing 通过合理划分车端Agent与路侧Agent的职责边界,并设计高效、鲁棒的交互机制,可以显著提升系统在复杂场景下的安全性与通行效率。 从工程视角看,这一体系本质上是一个分布式、多智能体协同决策系统,其设计思想对智慧交通、无人系统集群等领域同样具有重要参考价值。 该设计不仅符合自动驾驶工程落地对可靠性与可扩展性的要求,也为后续引入多Agent强化学习、博弈论协同决策等高级方法奠定了清晰、可演进的系统基础。
调研经验 在本次项目中,我负责了调研工作,其中用到了“问卷星”这一平台。 在这个平台上可以比较轻松地设计和发布问卷,并查看统计结果。
TencentDB Agent Memory 正式开源:让 Agent 沉淀经验,让人专注创造。今天,腾讯云数据库团队正式开源 TencentDB Agent Memory 。 无论是面向 C 端的对话助手,还是面向开发者的长周期 Agent,底层都依赖类似的"记忆层"承载跨会话偏好与历史经验,并逐渐收敛出一套通用的接口范式。 TencentDB Agent Memory 正是在这一背景下诞生的:让 Agent 学会你的工作流程、保留任务上下文、复用历史经验——以符号化记忆化解单次长任务的信息过载,以分层记忆沉淀跨会话的经验资产 通过把不同粒度的信息放在不同的"楼层",构建分层式长期记忆能力来解决以上长周期任务问题:L0 原始对话层全量保留每一轮交互;L1 原子记忆层自动提取事实、偏好、约束、阶段结论;L2 场景归纳层按任务自动聚合;L3 沉淀经验,让人更专注于创造。
无论是面向 C 端的对话助手,还是面向开发者的长周期 Agent,底层都依赖类似的"记忆层"承 载跨会话偏好与历史经验,并逐渐收敛出一套通用的接口范式。 TencentDB Agent Memory 正是在这一背景下诞生的:让 Agent 学会你的工作流程、保留任务上下文、复用历史经验——以符号化记忆化解单次长任务的信息过载,以分层记忆沉淀跨会话的经验资产 通过把不同粒度的信息放在不同的"楼层",构建分层式长期记忆能力来解决以上长周期任务问题: L0 原始对话层全量保留每一轮交互; L1 原子记忆层自动提取事实、偏好、约束、阶段结论; L2 场景归纳层按任务自动聚合; L3 02 效率 过去,"更聪明的 Agent"往往意味着"更贵的 Agent",但 Agent 是按 Token 计费、按响应速度评价的,每多塞一段对话,就是成本和体验的双重损失。 沉淀经验,让人更专注于创造。
本文通过"虾社会"这一隐喻,系统性地探讨了Multi-Agent系统的公共基础设施设计。 然而,正如Chanetal.(2025)所指出的:"当前工具在很大程度上是不够的,因为它们并非为塑造Agent与现有制度(如法律和经济系统)或行为者(如数字服务提供商、人类、其他AIAgent)之间的交互而设计 Agent基础设施的概念:AgentInfrastructure=外部于Agent的技术系统和共享协议,旨在调解和影响Agent与其环境的交互。 个人玩家1-3❌不需要—团队用户5-20⚠️部分需要❌成本太高平台运营100+✅必须有✅有能力Chanetal.(2025)也讨论了这一问题,指出私营主体有动力构建大部分基础设施,政府介入仅在系统性风险管理时才必要 6.4局限性本文存在以下局限:缺乏大规模实验验证:我们的公共服务架构停留在设计阶段,尚未在100+Agent的场景中验证平台依赖性:我们的实现基于Multi-Agent平台,架构设计可能不完全适用于其他
今天这篇文章,我将从源码层面,逐模块拆解这套系统的完整实现。如果你是AIAgent开发者、LLM应用架构师,或者对"AI如何从经验中学习"这个问题感兴趣,这篇文章值得你收藏细读。 HermesAgent的Skills闭环系统由7个紧密协作的模块组成,覆盖了从经验提取到知识复用的完整生命周期。 下面这张图展示了一个Skill从"诞生"到"被使用并自我改进"的完整数据流:让我用一句话概括这个系统的本质:Skills系统让AIAgent像人类专家一样积累经验——把成功的做法写成SOP,在使用中持续修订 设计者希望Agent在完成当前任务的同时就修正Skill,而不是留到下次再说。因为如果不立即修正,这个过时的信息会在下一次使用时再次导致错误。 ……十一、设计权衡与改进空间任何系统设计都是权衡。
3.主键设计要合理主键的设计在数据库中非常重要,它用于唯一标识表中的每一行数据,并且在数据操作和查询中起到关键作用。 数据库设计复杂性:当表的字段数过多时,数据库的设计和维护变得更加复杂。这可能涉及到索引和关联表的设计,以确保数据的完整性和一致性。 常见形式是在第三范式(3NF)的基础上,进一步冗余,从而减少表关联。回顾下什么事数据库三范式(3NF)? 这可能会导致数据库出现不稳定的状态,从而影响系统的性能和可用性。可能会导致数据库的维护和管理成本的增加。这是因为外键关联需要额外的管理和维护工作,例如添加、修改或删除外键约束时需要额外的测试和验证。 15.SQL编写的一些优化经验避免使用SELECT * FROM 语句,应该只选择需要的列,以减少网络传输和提高查询性能。使用索引来提高查询速度,特别是在对大型表进行查询时。