WHO(谁负责) Skill 涉及三个角色,职责清晰分离: 角色 负责什么 核心能力 应用层(Agent框架) 技能注册、权限控制、元数据注入、实际执行 确定性、安全性、管理性 LLM 理解元数据、匹配用户意图 、选择技能、按指令执行 语义理解、推理决策 开发者/领域专家 编写 SKILL.md、开发脚本、定义业务规则 领域知识、工程实现 决策分工: • 应用层负责:"有什么技能可用"(提供菜单) • LLM 负责:"该用哪个技能"(根据菜单点菜) • 开发者负责:"技能该怎么做"(写菜谱) ⏰ WHEN(何时使用) 适用场景: 场景类型 示例 是否需要用 Skill 单次、简单任务 查天气、算算术 ❌ Function 上下文占用 50,000+ token 10,000 token 5倍节省 响应时间 3-5秒 1-2秒 2-3倍 成本 $0.15/次 $0.03/次 5倍节省 错误率 20% 2% 10倍提升 开发效率 的 5W1H 一句话版 WHAT = 给 LLM 看的 SOP(标准作业程序) WHY = 让 AI 从"会调用工具"变成"懂业务地工作" WHO = 应用层管注册 + LLM做决策 + 开发者写内容
今天是9月11日星期四,让我们一起来看看今天 Ai Agent 带来的 AI 领域的重要动态吧! 解决了AI原生开发中的安全挑战。 运行时风险*:只有在运行时才显现的风险,如凭证泄露或意外API调用 *不可预测行为*:AI生成的代码可能包含难以预测的漏洞 *扩展攻击面*:AI工具链的复杂性扩大了潜在攻击面 Docker的新方法帮助开发者在构建 AI Agent时嵌入运行时安全,为AI原生开发提供更可靠的安全保障。 can successfully haggle down the price of a car AI谈判员成功为购车者节省数千美元 CarEdge的30岁CEO Zach Shefska声称,他公司开发的
Discovery (扫描):Agent 启动时,只读取 SKILL.md 里的 name 和 description。内存占用极小,只为了“知道有什么”。 2. Agent Skills最大的改变就在于渐进式披露,其本质依然是行业中大家都在不断优化的提示词工程和上下文工程,其对提示词做了标准化拆分,通过在本地创建相关文件并控制文件的读取,只在Agent需要时自主且自动加载内容 反观Skills,Agent 最初只加载多个 Skills 的元数据(每个 Skill 占用几百 token),当 Agent 认为需要使用某个具体的 Skill,就会读取这个 Skill.md 说明( 几千 token) Skill 里还可以无限嵌套下去,告诉 Agent,想要深入了解某个具体问题,还可以继续读取哪份文件。 官方文档: https://platform.claude.com/docs/en/agents-and-tools/agent-skills/overview
本文主要记录下如何创建一个简单的java Agent,并配置运行。 1.创建Agent类 package com.java4all.grouth.agent; import java.lang.instrument.Instrumentation; /** * @ description: java Agent * @author: IT云清 */ public class MyAgent { public static void premain(String ,args:"+agentArgs); } } 2.MANIFEST.MF 配置文件 这里在src/main/resources/META-INF/下创建一个MANIFEST.MF文件,指定Agent : true 3.打包配置 在pom.xml中配置打包信息 <build> <finalName>my-agent</finalName> <plugins>
要开发一个能深入理解项目的智能体(Agent),需要考虑多方面的项目理解和推理能力。 个文件包含依赖引入 """ return report四、使用示例 # 使用智能体分析项目 if __name__ == "__main__": # 初始化智能体 agent = ProjectUnderstandingAgent("/path/to/your/project") # 生成完整分析报告 report = agent.generate_report () print(report) # 获取详细的项目理解 project_understanding = agent.understand_project()
多模态Agent开发实战入门一、什么是多模态Agent?多模态Agent是指能够同时处理和理解多种类型数据(文本、图像、音频、视频等)的智能体,并能基于这些理解执行任务、做出决策。 )跨模态推理(图文关联、音画同步)工具调用(API、数据库、物理设备)自主规划与执行二、技术栈选型主流框架框架特点适用场景LangChain生态丰富,支持多模态模型快速原型、RAG应用AutoGen多Agent 协作,对话驱动复杂任务分解CrewAI角色化Agent,结构化流程业务自动化LangGraph图控制流,状态管理需要精确控制的流程多模态模型选择闭源API:GPT-4V、GPT-4o、Claude 3、 协作冲突引入仲裁Agent;明确角色分工(如CrewAI的Process)四、项目实践路线第1周:掌握基础API调用(GPT-4V或Qwen-VL)→ 完成图文问答第2-3周:集成LangChain → 构建可调用工具(搜索、计算、数据库)的Agent第4-5周:添加记忆模块 → 实现多轮对话上下文保持第6-8周:多模态RAG → 图片库检索 + 文档问答进阶方向:视频流理解、语音交互、多Agent协同
Agent 编排层:Agent Manager、LangGraph 编排、Agent Factory、FC(Function Calling) 3. 领域能力层:MCP Server、领域 Sub Agent、高阶 Sub Agent 5. 知识与记忆:知识来源、记忆系统(长期/短期) 6. 再接 MCP Agent(复杂交互) 路径:`Top Agent -> 包装工具 -> Sub Agent(LangGraph) -> MCP Server -> 后端服务` 适合:多轮工具调用、 复杂业务规则、需要 Sub Agent 自主推理。 Top Agent 先接 FC 跑通 1 个核心业务场景。 3. 再按业务需要逐步引入 MCP、Sub Agent、RAG。 4. 同步接入日志、Tracing、重试和超时机制。
Spring AI Alibaba 项目从架构上包含如下三层: Agent Framework 是一个以 ReactAgent 设计理念为核心的 Agent 开发框架,使开发者能够构建具备自动上下文工程和人机交互等核心能力的 Agent。 Graph graph 是一个低级别的工作流和多代理协调框架,能够帮助开发者实现复杂的应用程序编排,它具备丰富的预置节点和简化的图状态定义,Graph 是 Agent Framework 的底层运行时基座
Java Agent 概况 简介和功能 Java Agent是一种特殊的Java程序,允许开发者在 Java 应用程序运行时对其进行动态修改和监控的机制。 那么,我们如何开发一个 Java Agent 呢,下面我们来仔细说说。 开发 Java Agent 需要遵循一下规范,下面是几个必备的部分: 实现 premain 方法 premain 方法是 Java Agent 的入口点,类似于主程序的 main 方法。 实用案例 性能监控 Java Agent技术在性能监控领域的应用非常广泛,它可以帮助开发者实时监控应用程序的运行状态,识别性能瓶颈。 漏洞扫描:Agent可以集成漏洞扫描工具,对应用程序进行深度的安全检查,及时发现并修复安全漏洞。 性能影响 开发Java Agent时,性能影响是一个需要特别关注的问题。
PRD(产品需求文档)已死 在 Claude 时代之前,PRD 是软件开发的核心。EPD 的流程通常是这样的: 1. 有人(通常是产品经理)有了一个想法 2. 产品经理写一份 PRD 3. 工程师将原型图转化为代码 想法 → PRD → 原型图 → 代码 这并非硬性规定(在初创公司这些步骤是融合的,最好的构建者能同时做多项工作),但这是教科书式的开发方式。 现在他们只需要与Agent沟通。这意味着他们仅凭自己就能产生比以往任何时候都大得多的影响力。 2. 编程Agent是刚需 随着编程Agent让实施变得廉价,使用它们成为了一种要求。 能够采用编程Agent的人将能凭一己之力做更多的事: • 产品经理: 采用编程Agent可以直接通过构建原型来验证想法,而无需撰写规格说明书和等待。 • 设计师: 采用编程Agent可以在代码中迭代,而不仅仅是在 Figma 中。 • 工程师: 采用编程Agent可以将时间从实施转移到系统思考。
最近笔者在找智能体框架,看到一个文章:https://ai.plainenglish.io/11-best-ai-agent-frameworks-for-software-developers-afa1700644bc 本指南将深入探讨当前最优秀的 11 个 AI Agent 框架,比较它们的特性、优势、劣势以及理想的应用场景,帮助您为下一个项目做出明智的决定。 什么是 AI Agent 框架? 11 个最佳 AI Agent 框架 1. LangChain LangChain 是一个开源框架,已成为构建 AI 驱动应用最受欢迎的选择之一。 测试 if __name__ == "__main__": asyncio.run(main()) 11. 无论您需要用于构建对话 Agent、多 Agent 协作系统,还是复杂工作流自动化的框架,本指南介绍的 11 个框架都提供了多种选择,以满足不同的需求和技术专业水平。
对于Agent的价值,一直抱有怀疑态度,甚至认为未来会不会像大前端一样 别看现在火爆得不行,其实再走到下一个节点,就如前端一样,在裁员批次里面是第一梯队 因为它只是个连接器,一端是大脑LLM,另一端是之前承载业务的平台或专业软件 像一个垂直类专业软件,需要花费很多的资源去培训客户,但如果有了agnet,通过自然语言直接对话,都不需要去学习软件的使用,就能产出相应的结果 有点类似后端程序,可能都不清楚产品前端界面是什么样,开发一个个接口逻辑就行了 在看到arthas也出品了agent,这感觉具象化了,对于arthas 我是实实在在的使用客户。 但有了agent 那就更方便了,什么都不需要,把碰到的问题直接使用自然语言抛给agent,它能帮你分析,帮你执行命令。 相当方便 本来打算学习一下arthas agent,结果agent也没对外开源,只是阿里内部使用。
ReAct(Reasoning + Acting)是一种将推理和行动相结合的 Agent 范式。在这个范式中,Agent 会: 1. 迭代:基于观察结果继续思考和行动,直到完成任务 这个循环使 Agent 能够: • 将复杂问题分解为多个步骤 • 动态调整策略基于中间结果 • 处理需要多次工具调用的任务 • 在不确定的环境中做出决策 Graph 由节点(steps)和边(connections)组成,定义了 Agent 如何处理信息。 Agent 在这个 Graph 中移动,执行如下节点: • Model Node (模型节点):调用 LLM 进行推理和决策 • Tool Node (工具节点):执行工具调用 • Hook Nodes (钩子节点):在关键位置插入自定义逻辑 ReAct Agent 的工作方式其实挺像人类解决问题的过程。
Jakarta EE 11 在 Hashtag Jakarta EE 每周博客 中,Eclipse 基金会 Jakarta EE 开发大使 Ivar Grimstad 介绍了 关于 Jakarta EE 11 的最新消息,他写道: Jakarta EE 11 终于 发布 了! Eclipse GlassFish 再次成为 Jakarta EE 11 平台 和 Jakarta EE 11 Web Profile 规范的批准实现。 要了解更多关于这个新版本的信息,开发者可以参加定于 2025 年 7 月 10 日 16:00 UTC 举行的 直播活动。 Agent2Agent Java SDK 红帽 宣布,Quarkus 和 WildFly 团队已经与谷歌合作推出了 Agent2Agent Java SDK,这是一个 Java 库,实现了 Agent2Agent
尤其是做Agent的时候,Prompt写不好,不只是回答丑一点,而是接口挂、JSON解析挂、教师端页面挂、学生画像误判,最后后端还要背锅。我之前做高校学情分析Agent的时候,就被这个东西反复折磨。 在Agent开发中,提示词经常不是一次性文本,而是由后端模板、用户输入、检索内容、工具返回结果拼接而成。 项目不大,但数据源很碎:学生画像、课程访问记录、作业记录、测验分数、教师备注、RAG检索出来的课程资料,全都要塞给Agent。 比如你要写一份Agent开发文档,很多人会直接这样问:展开代码语言:TXTAI代码解释帮我写一份高校学情分析Agent的开发文档,越详细越好。模型确实能写。 里面故意保留了一点我平时开发会出现的东西,比如忘删的console.log,还有注释掉的旧代码。
MCP(Model Context Protocol,模型上下文协议) 2024年11月底,由 Anthropic 推出的一种开放标准,旨在统一大模型与外部数据源和工具之间的通信协议。 对于 LLM 开发者,MCP 是一个变革性的协议。 它消除了为每个数据源或工具进行定制集成的需要,减少了开发时间和维护成本。 从本质上来说,MCP是一种技术协议,一种智能体Agent开发过程中共同约定的一种规范。 在统一的规范下,协作效率就能大幅提高,最终提升智能体Agent的开发效率。 传统的Function calling技术要求围绕不同的外部工具API单独创建一个外部函数,类似一把锁单独配一把钥匙,而一个智能体又往往涉及到多个外部工具设计,因此开发工作量很大。 VS Function calling Function Calling是AI大模型模型调用函数的机制, MCP是一个标准协议,使大模型与API无缝交互, 而AI Agent是一个自主运行的智能系统,利用
作者 / 产品经理 David Winer 在往期 #11WeeksOfAndroid 系列文章中我们介绍了 联系人和身份、隐私和安全、 Android 11 兼容性 ,本期将 聚焦语言 。 本期我们将深入探讨 Android 三种核心语言的所有最新资讯: 从 Kotlin 协程到 Android 11 新的 Java API,再到更出色的本地开发工具,最新版本中包含了很多内容。 Kotlin 与协程 Kotlin 是现代 Android 开发与指导性开发库的核心。 在 Android 11 中,我们力求不断改进对这两种语言的支持。在 Android 11 Beta 中,我们使用来自 OpenJDK 9、10 和 11 的许多新 API 升级了 Java 库支持。 对于 Android 11,我们还更新了 Android 运行时间 (Android runtime),以通过 I/O 预取 加快应用的启动速度。 C++ 开发者的体验也在不断改善。
在 AI Agent 的上下文中,规划通常涉及 Agent 接受高级目标,并自主或半自主地生成一系列中间步骤或子目标。 良好的规划能力使 Agent 能够处理非简单的单步查询问题。它使 Agent 能够处理多方面的请求,通过重新规划适应不断变化的情况,并编排复杂的工作流。 这个过程重复进行,直到 AI 最终通过满足每个要求而达到"True"状态,或直到它达到预定义的尝试次数限制,就像开发人员在截止日期前工作一样。 通过实施此模式,开发人员可以将简单的反应 Agent 转变为能够自主和可靠运行的主动的、以目标为导向的系统。 监控涉及观察 Agent 的行动、环境状态和工具输出。 来自监控的反馈循环允许 Agent 调整、修订计划或升级问题。
目录执行摘要框架概述详细对比分析优劣势分析发展前景选型建议执行摘要本报告对四个主流Agent开发框架进行了全面对比分析:Eino(字节跳动)、AgentScope(阿里巴巴)、Youtu-Agent(腾讯 Youtu-Agent - 腾讯优图基本信息:开发公司:腾讯优图实验室主要语言:Python开源时间:2025年9月定位:零闭源依赖智能体框架核心特点:零闭源模型依赖YAML配置简化操作成本可控的开源模型支持基于 开发易用性AgentScope: ⭐⭐⭐⭐⭐ 低代码+可视化界面Youtu-Agent: ⭐⭐⭐⭐ YAML配置简化Spring AI Alibaba: ⭐⭐⭐⭐ Spring注解驱动Eino: ⭐⭐⭐ Python技术栈团队Youtu-Agent (腾讯)优势:零闭源依赖:完全基于开源模型,成本可控配置简单:YAML配置降低开发门槛成本优势:避免商用模型授权费用腾讯生态:与腾讯云服务深度集成劣势:功能相对基础 (成本控制)AgentScope(快速开发)Spring AI Alibaba(Java团队)研究机构/高校:AgentScope(研究友好)Eino(性能研究)Youtu-Agent(开源研究)高并发场景
experimental=null, roots=null, sampling=null, elicitation=null], clientInfo=Implementation[name=north-agent =tools/call, id=5fc929e0-2, params=CallToolRequest[name=jvm, arguments={}, meta={user_id=user-001, _AGENT