本节重点 学习 AI 智能体的概念和构建方法,掌握如何实现具有自主决策能力的 AI 系统。 具体内容包括: AI 智能体概念与特点 智能体实现关键技术 使用 AI 智能体的多种方式 OpenManus 实现原理 自主实现 Manus 智能体 智能体工作流编排 A2A 协议 一、什么是智能体? 二、智能体实现关键技术 在自主开发智能体前,我们要先了解一下智能体的关键实现技术,也就是方案设计阶段做的事情。 综合上面 4 类技术,并且结合 CoT、Agent Loop、ReAct 等机制(可以总称为 “规划执行机制”),我们就可以构建一个完整的、有自主规划能力的智能体系统啦。 目前很多公司都在用这种方法构建复杂的智能体工作流,确实很方便~ OWL 框架 前面提到过 AI 智能体依赖工具调用能力来拓展能力边界,这里再给大家分享一个很实用的开源项目 OWL。
在LLM和构建AI智能体的时代,感觉我们仍像是在玩弄原始的HTML和CSS,试图弄清楚如何将它们组合起来以创造良好的体验。除了某些最基础的概念外,还没有哪一种构建智能体的方法成为标准。 话虽如此,如果你是构建智能体的新手,有很多关于如何搭建基础脚手架的资源。但当涉及到构建严肃的生产级应用时,情况就完全不同了。 构建长时运行智能体的理论 让我们从可靠性说起。 这需要更精细的把握,并且实际上是构建AI智能体的工程师们的首要工作。 以一种常见的智能体类型为例。 结果,子智能体1实际上误解了你的子任务,开始构建一个看起来像《超级马里奥》的背景。子智能体2为你构建了一只鸟,但它看起来不像游戏素材,其移动方式也与Flappy Bird中的完全不同。 迈向更通用的理论 这些关于上下文工程的观察,仅仅是我们未来可能认为是构建智能体标准原则的开端。还有许多未在此处讨论的挑战和技术。在Cognition,构建智能体是我们思考的一个关键前沿。
当前基于大语言模型(LLM)的智能体构建通过推动自主科学研究推动 AI4S 迅猛发展,催生一系列科研智能体的构建与应用。 与传统综述不同,本篇综述为大家呈现了科研智能体的「漫游指南」,旨在提供构建科研智能体的「说明指南」:从科学研究的全周期出发,概述了科研智能体的分级策略,并详细阐述了对应等级的构建策略与能力边界;同时该「 漫游指南」详细阐明了如何从头构建科研智能体,以及如何对科研智能体的定向能力进行增强。 通过结合科学研究全生命周期与科研智能体构建策略,本综述深入剖析了构建策略与科研流程之间相互促进与协同的过程,揭示了科研智能体设计与应用之间的独特联系。 图 3|不同等级科研智能体汇总 从头构建科研智能体 本综述凝练了科研智能体的构建过程,从头构建科研智能体的工作流主要为知识组织、知识注入以及工具集成三个部分构成。
智能体在AI中的角色 智能体(Agent)是AI领域中一个关键的概念,它指的是能够在特定环境中自主运作并执行任务的软件实体。智能体不仅可以感知其环境,还能做出决策并采取行动以达成目标。 功能定义:列出智能体需要实现的具体功能。 场景模拟:设想智能体在不同情境下的应用案例。 性能指标:确定智能体的性能标准,如响应时间、准确性等。 智能体架构设计 智能体的架构设计是构建其内部结构和组件的过程。一个良好的架构设计能够确保智能体的灵活性、可扩展性和可维护性。架构设计的关键要素包括: 感知模块:负责收集环境信息。 这些工具和平台能够提供必要的支持,帮助开发者快速构建和测试智能体。 开发环境:选择支持智能体开发的语言和开发环境,如Python、Java等。 开源框架与库 利用开源框架和库可以减少开发工作量,同时利用社区的力量来改进和维护智能体: 机器学习框架:如TensorFlow、PyTorch等,用于构建和训练智能体的模型。
工具:智能体可以根据用户请求执行的预定义函数。 工具箱:智能体可用工具的集合。 系统提示:指导智能体如何处理用户输入并选择合适工具的指令集。 2. 实现 现在,让我们卷起袖子开始构建吧! 构建智能体 2.1 前提条件 在运行代码之前,确保你的系统满足以下前提条件: 1. Python环境设置 你需要安装Python来运行AI智能体。 步骤4:构建工具箱 ToolBox类存储智能体可以使用的所有工具,并为每个工具提供描述: class ToolBox: def __init__(self): self.tools_dict 总结 在这篇博文中,我们探索了智能体的概念,并一步步实现了它。我们设置了环境,定义了模型,创建了基本工具,并构建了一个结构化的工具箱来支持我们智能体的功能。 最后,我们通过运行智能体将所有内容整合在一起。 这种结构化方法为构建能够自动执行任务并做出明智决策的智能交互式智能体提供了坚实的基础。
不要直接将一个大而全的上下文扔给 LLM,而是构建多个小的专项 Agent 完成专项任务。 cubic(https://www.cubic.dev/) 是由前Instagram和Meta工程师创建的人工智能代码审查平台,其核心功能之一是 AI 代码审查 agent,可在 PR(Pull Request 1 打脸阶段:一个万能的单一智能体 最初的架构非常直接,但问题显著: graph LR diff[diff] --> 提示词[一个很大的提示词文件,并将整个代码库做为上下文的一部分] --> 返回的评论列表
基于SKILL构建 AI 智能体,本质上就是让AI从即兴发挥变成按规办事,让每一项能力都可注册、可调度、可监控、可迭代。 SKILL 架构的核心价值2.1 模块化将智能体的能力拆分为独立的SKILL单元,每个SKILL负责一项具体任务,开发时可分工协作,不同开发人员负责不同SKILL;迭代时只需修改对应 SKILL,无需改动整个智能体代码 五、SKILL 智能体完整实现1. 步骤 3:实现Agent Core + 调度执行引擎 这里我们构建了一个基于SKILL的 AI 智能体后端服务,主要用于演示如何通过意图识别来调用特定功能。 AI 智能体,本质上是把一套杂乱、松散的 AI 能力,整理成标准化、可管理、可落地的工程化体系。
5月21~22日,IBM针对合作伙伴在上海举办了“AI智能体构建工作坊”,基于watsonx平台进行了实战教学,两天亲身完整体验了企业级智能体应用的构建。 watsonx Orchestrate通过Skill Studio实现企业基于API、技能流和自动化智能决策工作流的技能构建,构建好的技能可以直接用于AI智能体或AI助手。 watsonx.ai提供了各种大小模型的训推环境,为智能体的构建提供了Langraph,CrewAI等框架,提供基于Notebook和可视化界面方式构建智能体,并封装提供AI服务的能力。 ,可以微调一个基础模型,可以可视化构建一个新模型,可以基于Python或R语言notebook构建智能体和模型等。 企业级智能体平台应该能够为构建智能体提供所有的构建积木块(能力、工具和技术),提供简便的构建方法,并提供部署运行和运营监控的载体。
智能体(Agent)与工作流(Workflow)已逐渐成为串联大模型、工具与实际业务场景的核心载体。业务场景的实际落地离不开标准化流程,而Agent则为标准化流程,提供了智能升级的新方法。 1.2,Agent 智能体 Agent 是具备自主决策能力的AI实体。依靠大模型的认知与推理能力,动态决定任务执行的流程、工具调用时机与方式,拥有核心决策权。 1.3,Agentic 系统 Agentic 系统是通过“智能体化”设计,将大模型、工具与流程整合,实现任务自动化或半自动化执行的系统。 其核心并非“是否自主决策”,而是“以智能体为核心串联资源,达成任务目标”,所以无论是预编排的工作流,还是具备自主决策权的Agent,都属于Agentic系统 构建Agentic系统的一个核心原则:保持工作流简洁 2.7,自主智能体Agent 核心逻辑:以用户指令或任务为起点,自主规划任务执行路径。 如果用户的指令是清晰的,智能体就可以自己规划独立的完成任务。
智能体(Agent)与工作流(Workflow)已逐渐成为串联大模型、工具与实际业务场景的核心载体。业务场景的实际落地离不开标准化流程,而Agent则为标准化流程,提供了智能升级的新方法。 1.2,Agent 智能体 Agent 是具备自主决策能力的AI实体。依靠大模型的认知与推理能力,动态决定任务执行的流程、工具调用时机与方式,拥有核心决策权。 1.3,Agentic 系统 Agentic 系统是通过“智能体化”设计,将大模型、工具与流程整合,实现任务自动化或半自动化执行的系统。 其核心并非“是否自主决策”,而是“以智能体为核心串联资源,达成任务目标”,所以无论是预编排的工作流,还是具备自主决策权的Agent,都属于Agentic系统 构建Agentic系统的一个核心原则:保持工作流简洁 2.7,自主智能体Agent 核心逻辑:以用户指令或任务为起点,自主规划任务执行路径。 如果用户的指令是清晰的,智能体就可以自己规划独立的完成任务。
2)业务实操,评测数据集构建和分类体系。 3)以深度研究评测为例,介绍 RACE 和 FACT 评测框架。 1,评估的必要性 辛苦上线后的Agent,用户反馈说体验变差了!团队的天都塌了。 3,深度研究 Agent 测试集准备 深度研究Agent(Deep Research Agent DRA)定义:需要智能体执行多轮网络搜索、信息收集、分析处理并生成高质量报告的复杂问题。 3.1,意图体系构建 收集目标数据集 DeepResearch Bench 收集了一个包含96万个原始用户查询的内部数据集,这些查询来源于用户与支持网络搜索功能的LLM聊天机器人的交互记录。 拔尖任务 确定各主题领域的目标任务数量后,研究重点转向构建既具有高度挑战性又基于真实研究需求的研究任务。这一过程专门用于测试深度研究智能体能力的上限。 ;用于衡量智能体引用的精确度,反映使用合适来源准确支撑陈述的能力。 • 每任务平均有效引用数(E. Cit.);量化agent在每个任务中检索并呈现的有价值且可验证信息的平均数量。
绪论:大型语言模型的状态危机与记忆抽象的范式转移 在当代人工智能的发展轨迹中,构建具备长期连贯性、复杂推理能力以及自我演化特征的自主智能体(Autonomous Agents)始终面临着一个基础性的架构瓶颈 基于上述理论背景,本文将深入剖析如何利用 MemNet:https://github.com/TianqiZhang/mem.net 这一专为智能体设计的统一记忆基础设施,在其之上构建严谨的 Zettelkasten 二者的结合,为构建具备可组合性、简单性且防冲突的下一代智能体记忆系统提供了完整的蓝图。 确定性上下文组装与认知工程 在智能体利用 Zettelkasten 执行复杂任务时,最为关键的步骤是在将提示词(Prompt)送入大语言模型进行推理之前,构建高质量的上下文环境。 通过这种方式,智能体可以动态地修改每个回合之间的上下文,实施摘要、剪枝或重新构建框架的操作,从而有效地遏制认知漂移的发生。
摘要 在AI技术加速迭代的背景下,企业构建智能体生态已成为数字化转型的核心战略。 本文以腾讯云智能体开发平台为核心,结合行业趋势与实战案例,解析企业构建智能体生态的关键路径,并重点呈现腾讯云在模型能力、协作框架及全链路服务上的创新突破。 一、智能体生态构建的核心挑战与趋势 1.1 企业智能体落地的三大核心痛点 数据孤岛:非结构化知识难以激活,业务系统间协同效率低(如某制造企业因数据分散导致智能体决策偏差); 技术门槛:需同时掌握大模型调优 二、腾讯云智能体开发平台:构建生态的“技术底座” 2.1 核心能力矩阵 腾讯云智能体开发平台基于混元大模型与DeepSeek系列模型,提供三大技术突破: 能力维度 技术特性 结语:智能体生态的终局价值 企业构建智能体生态的本质,是建立“数据-知识-决策”的自进化系统。
二、什么是反应式智能体 反应式智能体的设计源于对自然界(如昆虫)高效行为的观察,一只蜜蜂不需要构建整个花园的认知地图,它只需根据光线、花朵形状和气味等即时感官输入,就能做出飞向花蜜的决定。 四、反应式智能体的构建 - 包容架构 如何将多个简单的“条件-动作”规则组合起来,形成复杂的行为?机器人学家罗德尼·布鲁克斯提出了经典的 “包容架构”。1. 完整构建步骤1. 定义任务和目标: 明确智能体需要完成什么。例如:“在房间里漫游而不撞到任何东西”。2. 识别相关情境: 列出智能体在执行任务时可能遇到的所有关键场景。 反应式智能体代表的是一种工程哲学:用简单、可靠、可验证的组件构建复杂的智能系统。它提醒我们,有时候最有效的解决方案不一定是最复杂的。 在追求更复杂AI技术的今天,理解反应式智能体的原理和价值,不仅有助于我们构建更可靠的实时系统,也为我们理解智能的本质提供了重要的视角。
本文通过完整示例演示了如何使用GraphBit框架构建面向生产的智能体工作流程。我们将创建端到端的客户支持工单处理系统,展示图结构执行、工具调用和可选的LLM驱动智能体如何在一个系统中协同工作。 classify_ticket", c), ("route_ticket", rt), ("draft_response", dr), ] }构建有向 GraphBit工作流程,包含多个具有明确定义职责的智能体节点:SYSTEM_POLICY = "您是一个可靠的支持运营智能体。 result = executor.execute(wf) return result在单个工单上执行工作流程并捕获执行状态和输出,这最后一步说明了系统如何从离线确定性无缝过渡到完全智能体执行。 总之,我们实现了一个完整的GraphBit工作流程,涵盖运行时配置、工具注册、离线确定性执行、指标聚合,以及可选的基于智能体的外部LLM提供程序编排。
Graphiti 是一个框架,用于构建和查询具有时间感知的知识图谱,特别适用于在动态环境中操作的 AI 智能体。 Graphiti 的独特之处在于,它能够自主构建知识图谱,同时处理关系的变化并维护历史上下文。 Graphiti 与 Zep 的上下文工程平台 Graphiti 为 Zep 的核心提供支持,Zep 是一个为 AI 智能体提供开箱即用的上下文工程平台。 Zep 提供智能体记忆、图谱 RAG(用于动态数据)以及上下文检索和组装功能。 我们很高兴开源 Graphiti,认为它的潜力远远超出了 AI 记忆应用的范畴。 •选择 Graphiti:如果您需要一个灵活的开源核心,并且愿意构建/运营周围的系统。 为什么选择 Graphiti?
智能Agent作为基于千问大模型的智能框架,支持通过工具调用扩展能力,而天气API则提供了稳定、实时的气象数据服务。 本文旨在实现QwenAgent的Assistant助手与高的天气API的无缝集成,构建一个能响应用户自然语言查询、返回精准天气信息的智能系统。 role': 'assistant', 'content': '北京今天晴,温度25°C...'}总而言之,Assistant 类是 QweAgent 框架的核心,它提供了:简化的API接口:让开发者快速构建智能助手应用强大的工具集成 四、对比 function call 的实现 在《构建AI智能体:Function Calling - 解锁大语言模型的实际行动力+案例解析》一文中我们讲过通过Function Calling 、初始化Assistant,实现自然语言到天气数据的转换测试验证功能并解决常见问题 这个项目不仅提供了实用的天气查询功能,更重要的是展示了如何将 AI 大模型与实际 API 服务相结合,构建真正有用的智能应用
使用 Elasticsearch 和 GitHub Copilot SDK 构建 RAG 智能体 智能体构建器(Agent Builder)现已正式发布(GA)。 您可以从 Elastic Cloud 试用版开始体验,并在此处查看智能体构建器的文档:Elastic Agent Builder。 智能体互操作性 Model Context Protocol (MCP) / Agent2Agent (A2A) Protocol 无需编写新的工具函数,即可原生调用预构建的 Elastic 智能体。 分步指南:构建一个由 Elasticsearch 驱动的 Copilot 智能体 步骤 1:先决条件和环境设置 • GitHub Copilot 订阅:必需,除非使用自带密钥(BYOK)。 入门:使用 GitHub Copilot SDK 构建您的 Elasticsearch RAG 智能体 利用您自己的数据进行“接地”(grounding)可以解决幻觉问题。
这项研究系统拆解了构建这类智能体的四大核心系统:让AI拥有感知环境的"眼睛"、规划决策的"大脑"、存储经验的"记忆"和执行动作的"双手"。 多智能体协作的实际威力 该论文构建的多专家智能体协作系统显著提升了任务执行的性能上限与系统鲁棒性。 当子任务失败或环境变化时,智能体通过内部协作触发错误恢复机制,而非陷入预设流程的僵局。多个智能体提供的多样性视角也显著降低了因单点决策失效导致的整体崩溃风险。 这种基于协作实现的性能增益与容错能力,是传统单一智能体架构难以达到的。 如何构建你的第一个智能体 该论文系统阐述了构建LLM智能体的关键技术路径。 这些技术要素共同构成了功能完备的智能体工程体系。 结语:AI智能体的未来图景 该研究指出,模块化架构与专业化组件是构建具备类人认知智能体的核心路径。
作者: 星空有云(@Hpdoger, @noirfate, @byc_404),安全研究员,聚焦云与AI安全领域 来源: 第二届智能渗透挑战赛·决赛(腾讯云安全 TCU、腾讯云黑客松、Tencent 设计分层多智能体架构 针对上述问题,采用 “薄控制 + 厚状态” 的分层多智能体架构,将系统分为三层: Tier-0: Dispatcher(全局调度): 仅负责场景路由、轮询对账、生命周期管理及卡死恢复 在第二届智能渗透挑战赛的实战环境中,该框架实现了从资产收集到漏洞利用的自动化闭环: 自动化侦查流: 系统通过 Phase 1 端口扫描、Phase 3 目录扫描与静态API提取、Phase 4 指纹识别与 提炼智能体落地的三大核心原则 基于实战经验,构建可控、可靠、可持续的智能代理体系需遵循以下逻辑,这也是该方案在比赛中验证有效的根本原因: 巧妇难为无米之炊: 模型再强大也需要趁手的工具。 通过 多智能体架构 实现规划与执行的分离,利用 AUTO RUN 与 流程设计 放大执行效率。