AI智能体的开发框架指的是用于构建、部署和管理AI智能体的工具、库、平台和方法论的集合。选择合适的框架对于加速开发、确保可伸缩性、可维护性和最终的部署效果至关重要。 以下是一些主流的AI智能体开发框架和相关技术,可以根据具体需求进行选择和组合:1. 对话式AI/自然语言理解 (Conversational AI/NLU) 框架如果智能体需要进行自然语言交互。Rasa: 特点: 开源的对话式AI框架,支持端到端对话管理、NLU和对话策略。 5. MLOps 工具链 (Machine Learning Operations Toolchain)确保AI智能体在生产环境中可靠运行和迭代。 通过合理选择和组合这些框架,可以高效地构建出强大、可靠且可扩展的AI智能体。
智能体 Agent 核心是通过与环境交互更好的完成用户的指令或任务。一个合格的智能体应该具有那些能力,这些能力面临何种困难,又有那些的解决方案。 1.1,功能维度 复旦大学张奇团队在关于Agent的综述中,将基于大语言模型的智能体分为三功能模块:大脑 Brain、感知 Perception) 与行动 Action。 一个智能体的所具有的核心能力是一致的,本文以Planning、Memory和Tool use 为框架进行介绍。 2,规划 Planning 从完成任务的维度,智能体对任务进行拆解,然后对拆解的步骤进行反思。 举例: “一个篮子里有5个苹果,你拿走了2个,又放进去3个,最后有多少个苹果? ” 可以分为三个步骤进行拆解: 步骤1:初始有5个苹果。 步骤2:拿走2个,剩下5-2=3个苹果。
AI 智能体的开发框架是一系列工具、库和平台的集合,旨在简化和加速 AI 智能体的构建、训练和部署过程。 AI 智能体应用。 AI 智能体开发框架的共同特点:智能体框架: 定义智能体的结构和行为,包括感知、决策和行动等模块。强化学习算法: 提供多种强化学习算法,用于训练智能体。 环境模拟: 提供模拟环境,用于训练和测试智能体。总而言之,选择合适的 AI 智能体开发框架需要根据具体项目需求进行评估。 理解不同框架的特点和适用场景,可以帮助你做出更明智的选择,并更高效地开发出强大的 AI 智能体。
接下来的章节将介绍用于构建和集成 AI 智能体到你应用中的五大顶级平台。我们将探讨这些框架的核心特性与优势,并展示部分框架的智能体构建代码示例。 为什么使用多智能体 AI 框架? AI 智能体的局限性 尽管目前已有多个框架可以用来构建智能体助手,但真正投入生产使用的智能体应用仍然较少,仅有少数如 Cursor 和 Windsurf 被应用于 AI 辅助编程领域。 顶级五大多智能体 AI 框架 你可以使用多种 Python 框架将智能体集成到应用与服务中。这些框架覆盖无代码(可视化 AI 智能体构建器)、低代码和中代码开发工具。 Agno Agno 是一个基于 Python 的框架,用于将大型语言模型(LLMs)转换为 AI 产品中的智能体。 5. LangGraph LangGraph[23]是一个基于节点的 AI 框架,是目前最受欢迎的多智能体系统构建工具之一。它属于 LangChain 生态系统,专用于图结构化的智能体流程编排。
AI 智能体(AI Agent)的开发框架是构建智能体的核心工具和平台,它们提供了从数据处理、模型训练到部署和监控的全流程支持。以下是常用的 AI 智能体开发框架及其特点。 5.自动化机器学习框架5.1AutoKeras特点:自动化机器学习工具,支持自动模型选择和超参数调优。基于 Keras,易于使用。适用场景:快速构建和优化模型。 5.2H2O.ai特点:提供自动化的机器学习和深度学习工具。支持大规模数据处理和分布式计算。适用场景:企业级机器学习应用。 8.低代码/无代码 AI 平台8.1Google AutoML特点:提供自动化的模型训练和部署服务。支持图像、文本、表格数据等多种任务。适用场景:快速构建 AI 应用。 适用场景:企业级 AI 解决方案。总结AI 智能体的开发框架涵盖了从数据处理、模型训练到部署和监控的全流程。
AI 智能体的开发框架是为了简化智能体(Agent)的构建过程,提供了一系列预设的组件、工具和范例,帮助开发者更高效地实现智能体的感知、决策和行动能力。 AI 智能体开发框架的主要特点 (Key Characteristics):1.抽象化与模块化 (Abstraction & Modularity):框架通常会将智能体的核心功能(如感知、决策、行动、通信 5.集成 AI/ML 能力 (Integration with AI/ML Capabilities):许多框架设计时就考虑了与主流的机器学习和深度学习框架(如 TensorFlow, PyTorch, 选择合适的AI智能体开发框架取决于项目的具体需求、团队的技术栈偏好以及框架所适用的领域。 例如,如果重点是构建大量相互协作的智能体,可能会选择一个成熟的多智能体系统框架;如果重点是构建一个能够通过对话与用户交互的智能体,则会选择一个对话式 AI 框架。
最近笔者在找智能体框架,看到一个文章:https://ai.plainenglish.io/11-best-ai-agent-frameworks-for-software-developers-afa1700644bc 人工智能 Agent(智能体)彻底改变了软件开发者构建智能应用的方式。 AI Agent 框架是软件平台,使开发者能够构建具备以下能力的自主人工智能系统: 理解和处理自然语言输入- 对复杂问题进行推理 基于现有信息做出决策 采取行动以达到特定目标 通过互动进行学习并不断改进 5. LangGraph LangGraph 是 LangChain 创建的一个开源 AI Agent 框架,用于构建和管理复杂的生成式 AI 工作流。 对于希望构建复杂 AI 应用的开发者来说,这些框架提供了创建智能、自主系统所需的工具和基础设施。
译者 | 明知山 策划 | 丁晓昀 美国 Block 公司的开源项目办公室推出 Goose,一个开源、非商业用途的 AI 智能体框架,旨在自动化任务并与现有工具无缝集成。 Goose 作为一个自主的 AI 智能体,能够通过协调各种内置功能来执行复杂任务。用户可以集成他们偏好的大语言模型,确保了工具部署的灵活性。 项目贡献者 Antonio Song 强调了用户与 AI 工具交互接口的重要性: 我们大多数人几乎没有机会影响 AI 模型本身的开发。 开源 AI 智能体不再是一个业余项目——它们正在定义未来。Goose 1.0 标志着范式的转变:去中心化、非商业用途的 AI 框架,连接智能与现实世界。AI 领域一直被少数几个访问受限的模型所主导。 Goose 是一个模块化的 AI 智能体框架,可以安装、执行、编辑和测试任何大语言模型(而不仅仅是少数的几个)。 随着更多贡献者不断完善其功能,Goose 有望实现进一步的发展。
langchain 概述 langchain是LLM与AI应用的粘合剂,是一个开源框架,旨在简化使用大型语言模型构建端到端应用程序过程,它也是ReAct(reason+act)论文的落地实现。 chains,langchain把提示词、大语言模型、结果解析封装成chain,并提供标准的接口,以便允许不同的chain形成交互序列,为AI原生应用提供端到端的chain。 content='Hi.'), SystemMessage(content='你的角色是一个诗人.'), HumanMessage(content='用七言绝句的形式写一首关于AI messages) print(response.content) 这里的 ZHIPUAI_API_KEY 需要你自己去智普网站 https://open.bigmodel.cn 去注册就有,运行结果 智能助手显神通 的诗')] streaming_chat(messages) 运行结果 智能助手显神通, 问答之间意无穷。
AI 智能体应用层的开发框架主要用于将 AI 模型集成到实际应用中,并提供用户交互、数据处理、模型推理等功能。这些框架通常提供高层次的抽象和工具,帮助开发者快速构建和部署 AI 驱动的应用程序。 以下是常用的 AI 智能体应用层开发框架及其特点。1.Web 应用开发框架1.1Flask特点:轻量级 Python Web 框架,易于扩展。适合构建 RESTful API 和小型 Web 应用。 5.自动化与工作流框架5.1LangChain特点:用于构建基于大语言模型(LLM)的应用程序。支持链式调用、记忆管理和工具集成。适用场景:AI 驱动的自动化任务和智能助手。 5.2AutoGPT特点:基于 GPT 的自动化任务框架,支持目标驱动的任务执行。可以自动调用工具和 API。适用场景:自动化任务和智能代理。 总结AI 智能体应用层的开发框架涵盖了从 Web 应用、移动端应用到聊天机器人、自动化任务等多个领域。
本节重点 以 Spring AI 框架为例,学习 AI 应用开发的核心特性 —— 工具调用,大幅增强 AI 的能力,并实战主流工具的开发,熟悉工具的原理和高级特性。 1)联网搜索 2)网页抓取 3)资源下载 4)终端操作 5)文件操作 6)PDF 生成 而且这些需求还可以进行组合 如果 AI 能够完成上述需求,就不再只是一个有知识的 “大脑”,而是有手有脚,会利用工具完成任务的 “智能体” 了。 我们当然可以自主开发,不过还是更推荐使用 Spring AI、LangChain 等开发框架。此外,有些 AI 大模型服务商也提供了对应的 SDK,都能够简化代码编写。 框架控制的工具执行 这是默认且最简单的模式,由 Spring AI 框架自动管理整个工具调用流程。
模糊回答,而非幻觉,是AI智能体的隐形故障模式最大的失败并非声势浩大,而是悄无声息的。模糊性、语义漂移和隐藏的缺陷会在任何人注意到之前就侵蚀掉信任。 而这个框架展示了如何通过对齐检索和提示,将它们转化为具体、可信赖的回应。AI智能体的隐形故障大多数人担心的是幻觉。但真正的信任杀手是模糊性——那些看起来光鲜亮丽却言之无物的回答。 从支柱到管道当你看到它实际运行时,这个框架就变得鲜活起来。智能体的响应管道不仅仅是一系列步骤,而是两种理念之间的对话。 具备对齐策略的AI智能体响应管道阶段1:用户输入 → 词汇桥接行动 → 用户提交自然语言查询。风险 → 检索器-大语言模型词汇不匹配。 归根结底,真正的挑战不是让智能体听起来流畅,而是让它们听起来忠实。模糊性悄无声息地侵蚀信任,而明确性则一个答案接一个答案地赢回信任。
通过 CoT 思维链、ReAct 模式等核心技术,深入理解智能体的工作原理,并参考 OpenManus 开源框架实战开发能够自主规划执行任务的 AI 智能体。 如果使用 AI 开发框架,这些能力都不需要我们自己实现,代码量会简单很多。下面就让我们基于 Spring AI 框架,实现一个简化版的 Manus 智能体。 也可以直接使用专门的 AI 智能体工作流编排框架,比如 LangGraph 和 Spring AI Alibaba Graph。 目前很多公司都在用这种方法构建复杂的智能体工作流,确实很方便~ OWL 框架 前面提到过 AI 智能体依赖工具调用能力来拓展能力边界,这里再给大家分享一个很实用的开源项目 OWL。 实现 5)参考 OpenManus 的源码,实现更多功能,比如 “规划并执行” 模式的智能体工作流(参考 flow/planning.py) 本节作业 1)完成 AI 超级智能体的开发 2)理解 AI
AutoGen在Python开发者中很受欢迎,因为它可以用来构建多智能体AI系统。以下是入门方法。 AutoGen 是 Python 开发者中流行的框架,用于通过复杂的、对话驱动的协作和人机交互功能构建多智能体 AI 系统。 AutoGen 和 AI 代理的结构 AutoGen 通过其复杂的架构实现了 AI 代理结构的关键组件,从而能够创建多功能且强大的多智能体系统。 该框架支持显式和隐式委托策略,允许代理移交子任务、请求专业知识或协作解决复杂问题。委托通过智能路由机制进行,该机制评估代理能力、系统消息和之前的交互历史。 通过提供强大的代理交互、任务管理和工作流编排工具,AutoGen使开发人员能够创建智能、适应性和安全的AI应用程序。
AI智能体创作思路 AI智能体的核心在于模拟人类思维和行为模式,通过算法和数据处理实现自主决策。创作思路通常包括目标定义、数据收集、模型训练、评估优化等环节。 目标定义阶段明确智能体的功能边界,比如聊天机器人、游戏NPC或自动化工具。数据收集阶段获取相关领域的语料、图像或其他输入数据。模型训练阶段选择合适的算法架构,如深度学习、强化学习或规则引擎。 案例分析 以智能写作助手为例,分析其设计流程。需求分析阶段确定用户需要语法检查、内容生成或风格转换等功能。技术选型阶段可能采用GPT-3等大语言模型作为基础架构。 智能体的核心功能包括" input_ids = tokenizer.encode(input_text, return_tensors="pt") output = model.generate( 常见的分布式训练框架包括: Horovod:基于MPI的高性能分布式训练框架,支持TensorFlow、PyTorch等,适用于多GPU或多节点训练。
NotionAI智能体Notion3.0的AI智能体通过自动化流程实现复杂任务闭环。其核心能力包括智能搜索、数据分析、决策制定和执行操作。 零一万物万智2.5平台解析万智2.5平台采用多智能体协作架构,每个角色对应特定职能:市场智能体:自动生成营销方案并执行投放HR智能体:处理招聘全流程,包括简历筛选和面试安排财务智能体:实时监控预算并生成分析报表平台通过智能体间的通信协议实现协作 例如启动新项目时,系统自动组建包含产品、设计、开发智能体的虚拟团队,各角色通过API交换数据并同步进度。 :知识库建设:结构化企业数据供智能体调用权限管理:设置不同智能体的数据访问层级验证机制:关键决策需加入人工审核环节典型部署流程包括POC测试阶段,先选择单一业务场景验证,如自动生成周报,再逐步扩展至复杂业务流程 监控系统需记录智能体的决策路径和执行效果,便于持续优化。
langchain提供类似AgentExecutor这样的更高层次框架,适合快速开发和部署。 上图是LangGraph完整的图计算的模式,有开始,有结束,中间有很多节点,节点之间会有一定的关系。 我是人工智能助手智谱清言,可以叫我小智,很高兴见到你,欢迎问我任何问题。' model_name': 'glm-4', 'finish_reason': 'stop'}, id='run-b982480c-39d9-4445-8888-62a10339ef86-0')]} 状态持久化 许多AI
接AI智能体(四) MetaGPT 环境装配 metagpt下载地址:https://github.com/geekan/MetaGPT conda create -n metagpt python= gpt-3.5-turbo api_key: "******" 测试: 在终端命令行中进入Meta-GPT-main目录中执行 metagpt "Write a cli snake game" 单动作智能体 ") # Test case 2 assert sum_function([-1, 0, 1, 2, 3]) == 5 print("Test case 2 passed.") 多动作智能体 import asyncio import sys import subprocess from metagpt.llm import LLM from metagpt.actions import @Modified By: mashenquan, 2023/12/5.
接AI智能体(三) memory工具使用 以往,我们都是直接跟大模型进行交互,没有办法系统的实现记忆。 在上图中,用户在向大模型问问题时会首先读取记忆体,查看以往是否回答过相同的问题或者相关的文档可以参考。 如果有就会返回并添加到提示词模版中,再通过大模型的处理得到答案,得到答案之后再将答案反写回记忆体,这是一个循环的过程。 **跨链技术的进步**:随着跨链技术的发展,以太坊能够与其他区块链网络进行互操作,这可能会扩大其生态系统,并增加其作为价值转移和智能合约平台的吸引力。 5. 一个由数据保障和推动者组成的信任框架. 191. 为可信的数据使用建立保障措施.'] Thought:看起来在上一步的计算操作中,我应该得到的是乔·拜登的年龄,但实际操作环境反馈的信息与此无关。
接AI智能体(五) Dify Dify是一个开源的Agent开发平台,使用Dify有两种方式,一种是使用Dify的在线平台。https://cloud.dify.ai。 一种是进行私有化部署。 DEPLOY_ENV: ${DEPLOY_ENV:-PRODUCTION} CHECK_UPDATE_URL: ${CHECK_UPDATE_URL:-https://updates.dify.ai WEAVIATE_ENDPOINT: ${WEAVIATE_ENDPOINT:-http://weaviate:8080} WEAVIATE_API_KEY: ${WEAVIATE_API_KEY:-WVF5YThaHlkYwhGUSmCRgsX3tD5ngdN8pkih true} WEAVIATE_AUTHENTICATION_APIKEY_ALLOWED_KEYS: ${WEAVIATE_AUTHENTICATION_APIKEY_ALLOWED_KEYS:-WVF5YThaHlkYwhGUSmCRgsX3tD5ngdN8pkih :-true} AUTHENTICATION_APIKEY_ALLOWED_KEYS: ${WEAVIATE_AUTHENTICATION_APIKEY_ALLOWED_KEYS:-WVF5YThaHlkYwhGUSmCRgsX3tD5ngdN8pkih