首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏前行的CVer

    模型Agent

    PanelGPT💡: 💁🏼🎤 (👾💬) (🤖💭) (🤯🗯) 受到“三个臭皮匠,赛过诸葛亮”启发,设计one-shot的例子,让多个LLM同时给出答案,然后再用一个LLM打分,做决定。他们使用的prompt:3 experts are discussing the question with a panel discussion, trying to solve it step by step, and make sure the result is correct and avoid penalty:,这个prompt的效果要优于Let's think step by step:。

    35710编辑于 2024-05-15
  • 来自专栏白话互联

    【Ai Agent】Ai Agent News | 9月11日速递

    今天是9月11日星期四,让我们一起来看看今天 Ai Agent 带来的 AI 领域的重要动态吧! *角色定义*:明确AI Agent在企业中的定位和职责 *数据整合*:确保AI Agent能够访问高质量的相关数据 *行动规划*:设计Agent能够执行的具体任务和流程 *反馈机制*:建立持续学习和优化的闭环系统 *求职者Agent*:帮助求职者找到合适的工作机会 *招聘方Agent*:协助雇主筛选高质量候选人 其中,名为"Career Scout"的AI Agent能够为求职者提供个性化推荐,根据用户简历和偏好自动匹配职位 报告指出,这些系统不同于标准聊天机器人,它们能够自主行动、执行任务,并使用Model Context Protocol (MCP)和Agent-to-Agent (A2A)等协议与其他数字Agent协作 真正的Agent力量来自于它们相互连接、访问企业数据以及与执行工作的系统交互的能力。一个无法与其他Agent、工具和应用对话的Agent只是一个孤岛。

    40010编辑于 2025-09-17
  • 来自专栏圣杰的专栏

    .NET+AI | Agent | 人机协作(9

    MAF 审批 Agent 实战 一句话简介 通过 ApprovalRequiredAIFunction 为敏感工具加上人工审批环节,快速构建符合企业合规要求的 MAF 人机协作智能体。 添加审批包装 对高风险函数使用 new ApprovalRequiredAIFunction(innerFunction),Agent 仍像普通工具一样调用,但框架会在真正执行前抛出审批请求。 3. 将这些消息回传给 Agent,直到没有新的审批请求为止。 4. 创建 Agent var agent = chatClient.CreateAIAgent( instructions: "执行转账前必须获得用户确认", name: "BankAssistant 审批循环 var thread = agent.GetNewThread(); var response = await agent.RunAsync(userRequest, thread); var

    29610编辑于 2025-12-28
  • 来自专栏服务端技术杂谈

    AI Agent模型->工具->结果->模型

    Reddit上有人说,AI Agent就是:模型->工具->结果->模型。 从程序员角度来说,就是拼接参数json,调用LLM,处理返回值json。 Agent不只是聊天机器人,还需要工具,所以要先告诉Agent,你有哪些API/工具,这些工具可以做什么。 不需要用什么复杂的框架,基本上只需要串联: 用户输入目标Prompt->将提示词传递给LLM->模型决定下一步->需要工具(API调用、爬取网页、操作API)执行->将结果反馈给模型进行下一步->直到任务完成 即:模型 → 工具 → 结果 → 模型 关于记忆,先用短期记忆,比如最近几条上下文消息。 如果需要跨会话记忆,可以从持久存储获取,比如向量数据库。

    16810编辑于 2026-03-11
  • 来自专栏Python与算法之美

    9模型的评估

    模块中的交叉验证相关方法可以评估模型的泛化能力,能够有效避免过度拟合。 二,分类模型的评估 模型分类效果全部信息: confusion_matrix 混淆矩阵,误差矩阵。 ? 模型整体分类效果: accuracy 正确率。通用分类评估指标。 模型对某种类别的分类效果: precision 精确率,也叫查准率。模型不把正样本标错的能力。“不冤枉一个好人”。 recall 召回率,也叫查全率。模型识别出全部正样本的能力。 三,回归模型的评估 回归模型最常用的评估指标有: r2_score(r方,拟合优度,可决系数) explained_variance_score(解释方差得分) ? ? 留出法 为了解决过拟合问题,常见的方法将数据分为训练集和测试集,用训练集去训练模型的参数,用测试集去测试训练后模型的表现。

    1.1K31发布于 2020-07-17
  • 来自专栏XINDOO的专栏

    Agent设计模式——第 9 章:学习和适应

    基于 LLM 的 Agent 的少样本/零样本学习: 利用大语言模型Agent 能够用最少的示例或清晰的指令快速适应新任务,实现对新命令或情况的快速响应。 LLM 的目标是生成能够从奖励模型获得最高分的响应。奖励模型在训练过程中充当"评判员"。 这个两步过程可能既复杂又不稳定。 例如,LLM 可能会找到漏洞并学会"破解"奖励模型,为质量较差的响应获得高分。 DPO 方法(直接过程): DPO 完全跳过了奖励模型。 交易机器人 Agent: 通过基于高分辨率、实时市场数据动态调整模型参数来优化决策算法,从而最大化财务回报并降低风险因素。 欺诈检测 Agent: 通过使用新识别的欺诈模式改进预测模型来增强异常检测能力,提高系统安全性并最小化财务损失。

    51010编辑于 2025-10-27
  • 来自专栏创作是最好的自我投资

    基于 OpenCloudOS 9 × Cube Sandbox Agent 代码执行实践

    本文将基于OpenCloudOS9系统,从零搭建CubeSandbox环境,并通过一个完整的Agent代码执行实践,带你体验:如何在保障安全的前提下,让Agent真正"动起来"。 ,通过执行agent测试命令来检查APIkey是否正常工作openclawagent--session-id10330044-8c98-46b6-9cfb-50c8c3ac1b97--message"你好 "2>&1|head-80验证后发现,虽然已经将auth-profiles.json配置为qwen3.7-max,但agent仍然在请求openai/gpt-5.5模型,说明openclaw的主配置中默认模型仍然是 另外一种方案是不配置APIKey,在云服务器直接部署大模型服务,大家感兴趣的可以尝试#1.安装Ollamacurl-fsSLhttps://ollama.com/install.sh|sh#2.启动模型 /qwen2.5:7b"#5.配置完成后,执行以下命令验证#测试agent是否能正常运行openclawagent--session-id10330044-8c98-46b6-9cfb-50c8c3ac1b97

    76620编辑于 2026-05-22
  • 来自专栏玩转Lighthouse

    玩转Hermes Agent|云上Hermes Agent配置大模型指南

    一篇文章搞懂并教你快速搭建属于自己的HermesAgent>>HermesAgent一键部署指南快捷配置(推荐)Lighthouse控制台现已支持快捷配置模型,进入应用管理页签即可快速配置主流大模型手动配置步骤一 )获取APIKey:https://openrouter.ai/keysOpenRouter是一个模型聚合平台,通过一个APIKey即可访问200+个来自不同提供商的模型。 进阶配置配置备用模型(Fallback)当主模型遇到限流或故障时,HermesAgent可以自动切换到备用模型。 配置智能路由简单问题用便宜模型,复杂任务用主力模型,节省API开销。 Q:本地模型工具调用不生效怎么办?

    3.1K65编辑于 2026-04-26
  • 5种大模型Agent模式

    模型中的5种AI Agent模式在大模型中,AI Agent(人工智能代理)模式是一种重要的应用方式,可以从以下几个方面来理解:1. 在大模型的背景下,AI Agent 是基于大规模预训练模型(如 GPT 等)构建的智能代理,能够利用模型的语言理解和生成能力来完成复杂的任务。 智能性:它基于大模型的强大语言理解能力,能够理解自然语言指令,并生成自然语言响应。这种智能性使其能够处理复杂的语言任务,如对话、写作、翻译等。 工作原理感知与理解:AI Agent 首先通过输入(如用户指令、环境数据等)感知外部信息,然后利用大模型的语言理解能力解析这些信息,确定任务目标。 技术负责人(Tech lead agent)、开发运维(DevOps agent)、工程师(SDE agent):各司其职,协作完成任务。

    4.9K10编辑于 2025-05-07
  • 来自专栏技术汇总专栏

    面向 LLM Agent 的组织模型设计:多 Agent 协同的新范式

    面向LLMAgent的组织模型设计:多Agent协同的新范式一、引言:为什么多Agent系统需要“组织模型”随着人工智能系统从“单智能体”向“群体智能”演进,多Agent系统(Multi-AgentSystem 为了解决这些问题,组织模型(OrganizationalModel)被引入多Agent系统设计中,用于规范Agent的结构、职责与协作方式。 二、多Agent组织模型的核心要素一个完整的MAS组织模型通常包含以下三个关键维度:角色分配(RoleAssignment)权限管理(Authority&PermissionControl)任务协同策略 未来的Agent系统,不只是“更聪明”,而是“更有组织”。多Agent系统的复杂性本质上源于“多主体协作”本身,而组织模型正是将这种复杂性工程化、可控化的核心手段。 可以说,组织模型决定了多Agent系统是否具备规模化扩展与长期演进的能力,是多Agent从“概念验证”走向“工程落地”的关键基础设施。

    57710编辑于 2026-01-12
  • 来自专栏又见苍岚

    DE-9IM 空间关系模型

    DE-9IM 是Dimensionally Extended 9-Intersection Model 的缩写,直接翻译为 维度扩展的 9 个相交模型,本文记录相关内容。 简介 DE-9IM 是Dimensionally Extended 9-Intersection Model 的缩写,DE-9IM 模型是用于描述两个 二维几何对象(点、线、面) 之间的空间关系的一种模型 维度扩展九交模型(DE-9IM)是一种拓扑模型和标准,用于描述两个区域(二维中的两个几何图形,R2)的空间关系,在几何学、点集拓扑、地理空间拓扑、以及与计算机空间分析相关的领域。 空间关系 模型主要要描述的就是二维平面下的两个几何对象之间的空间关系。 DE-9IM 模型 DE-9IM 模型把几何对象分为 内部、边界、外部 三个部分,两个几何对象这三个部分两两之间的关系,就可以组合为一个3X3大小(就是 9 个值)的矩阵,这9个值的组合,就表示两个几何对象的空间关系

    1.2K10编辑于 2024-07-04
  • 来自专栏自然语言处理

    模型 Agent 就是文字艺术吗?

    最近在技术圈里有一个很有趣的争论:大模型 Agent 是不是就是各种 Prompt 的堆叠? 像 Manus 这样看起来很智能的 Agent,本质上是不是就是用巧妙的 Prompt 约束大模型生成更好的输出?换句话说,这是不是一门文字艺术? 这个问题引发了业内专家的激烈讨论,观点分化明显。 但关键是:Prompt 是 Agent 系统中大模型和其他各个组件的润滑油,而不是全部。 结论:既是也不是 回到最初的问题:大模型 Agent 是不是文字艺术? 答案是:既是也不是。 从某种意义上说,所有与 LLM 的交互最终都要通过文字(Prompt)来实现,这确实是一门语言艺术。 你觉得大模型 Agent 是文字艺术吗?欢迎在评论区分享你的观点。

    27001编辑于 2025-05-24
  • 来自专栏服务端技术杂谈

    Agent的瓶颈从来不是模型智力

    现阶段Agent的瓶颈从来不是模型智力,失败的原因大多来自于不被模型理解的上下文,如模式/规约/问题设定等。 如今,这一层被harness包裹起来。 比如上下文的存取与管理,提示词的缓存,工具的识别与调用,上下文冗余信息的最小化,会话信息的结构化,多agent等。 通用 agent 的通用性在于 harness,如文件管理/上下文读取与加载/安全校验与审计,而专有领域 agent 的上限来源于各种 skill,这些 skill 中包含了逻辑判断/业务流程/领域知识 确定性的工具层,有助于消除模型的幻觉,可以确保 agent 可控,判断力交给模型,执行力交给工具。 为了确保 Agent 在专有业务领域下跑的更好更快,应该避免给模型讲大道理或堆砌所有的 SOP,更好的方式是提炼与沉淀业务流程,固化为 skill。

    12410编辑于 2026-06-02
  • 鸡翅-大模型Agent开发实战

    鸡翅·大模型Agent开发实战:从入门到企业级落地的腾讯云全路径2026年,AI Agent已不再是实验室里的概念验证,而是企业降本增效、重塑业务流程的核心引擎。 本文基于鸡翅大模型Agent开发实战体系,结合腾讯云全栈AI工具链,为你拆解从零构建智能体的完整链路。 一、Agent的本质:给大模型装上"手脚"与"大脑"如果说大模型是"大脑",那Agent就是"大脑+手脚+记忆系统"的完整智能闭环。传统大模型擅长生成文本回答,但缺乏自主执行能力。 四、开发实战:从零搭建你的第一个Agent4.1 选基座模型国内开发者优先选择DeepSeek-V3.2,其多步工具调用能力可媲美海外顶级模型,成本降低80%。 本文基于鸡翅大模型Agent开发实战课程体系,结合腾讯云2026年最新产品能力编写。想要5分钟搭建你的第一个AI Agent?打开腾讯云AI开发套件,从零开始。

    20910编辑于 2026-06-09
  • 来自专栏菩提树下的杨过

    Agent设计模式学习(基于langchain4j实现)(9) - 人机协同

    HumanInTheLoop humanValidator = AgenticServices.humanInTheLoopBuilder() 28 .description("验证模型提出的招聘决策 nextLine() 指定为终端控制台输入(也可以根据需要,换成其它方式,比如:读数据库,调用接口从其它系统获取) 67-71行,则是根据人工指令做出的响应(即前面学过过的条件工作流),如果输入H,则执行下面的Agent 1 public class HoldOnAssist { 2 3 @Agent(description = "招聘流程暂缓") 4 public void abort() { 5 8 " 9 } 10 11 AI招聘助手建议: **招聘理由汇总:** 12 13 **优势:** 技术能力强,文化契合度良好,学习能力佳 14 15 **风险:** 缺乏React经验,薪资略超预算 /agentic_turoial_with_langchain4j 参考: Building Effective AI Agents \ Anthropic [译] AI Workflow & AI Agent

    31310编辑于 2026-02-01
  • 来自专栏AgenticAI

    给LLM Agent应用插上视觉模型的翅膀:封装ONNX加载的头部姿态评估模型作为Agent的工具

    如果将视觉模型按照LLM工具调用方式嵌入到大语言模型应用中,给大语言模型插上视觉模型必定能让你的LLM应用更为有趣。 在深入探讨ONNX如何赋能LLM Agent以视觉理解能力之前,如果您渴望更全面地理解这一领域的核心理论与实践,以下这部著作将是您不可或缺的伴侣: 话不多说,我们先看看看论文全称:6D Rotation the yaw of head"] Roll: Annotated[float, "the roll of head"] 然后通过autogen的register_function将函数注册到Agent 至此,我们已共同见证了ONNX如何为LLM Agent巧妙融入头部姿态评估模型,开启了多模态交互的新篇章。 在我们探索之旅的尾声,若您意犹未尽,渴望亲自操刀,将理论付诸实践,那么黄佳老师这本《大模型应用开发:动手做AI Agent》将是您理想的选择。 关注点赞不迷路哦!

    82300编辑于 2025-03-18
  • 帮人搭建 OpenClaw多Agent,7小时踩了9个坑

    结果花了7个小时,踩了9个坑。 先说结论:如果你正在使用OpenClaw,或者打算用,这篇文章能帮你省下至少7个小时的排错时间。 不吹不黑,纯记录。 坑 1:API Key 直接发出来,裸奔了。 因为朋友想要本地的OpenClaw可以控制远程的OpenClaw,这种叫做A2A,全称Agent To Agent。OpenClaw官方还不支持,只有插件支持。 坑 6:模型能不能用,除了名字还得看权限 离谱程度:⭐⭐ 到此为止,朋友的4个Agent都能跑起来了,但有一个模型怎么改都死活不回消息。 我用指令看了一下状态才破案,噢,没开这个模型的权限,模型提供商不让你用。 有时候排查方向全错,以为是自己的配置问题,其实是这个帐号被平台限制了,某些模型不让用。 坑踩到这里就结束了,后来我想了想,这7个小时、9个大坑的洗礼,其实并不是无意义的内耗,本质上是新技术普及的必然代价。

    45510编辑于 2026-04-21
  • 来自专栏Ywrby

    9-线程概念与多线程模型

    因此内核级线程的切换必须在核心态下执行 注意 操作系统只能“看见”内核级线程,因此只有内核级线程才是处理机分配的单位 以下方的多对多模型为例,其由三个用户级线程映射到两个内核级线程上,在用户看来,进程中同时有三个线程并发执行 ,但在操作系统看来,只有两个内核级线程,所以哪怕是在4核处理机的计算机上运行,该进程也最多只能被分配到两个核心,最所只有两个用户进程并行执行 多线程模型 多对一模型 一对一模型 多对多模型

    41710编辑于 2022-10-27
  • winform部署yolov9的onnx模型

    C# WinForms 部署 YOLOv9 ONNX 模型简介 在当今的计算机视觉领域,目标检测是不可或缺的一项技术。 ONNX是一个开放的模型表示,使得不同深度学习框架之间可以相互转换和共享模型。这使得YOLOv9模型可以在C#环境中得到高效利用。 用户可以通过界面上传图像,应用程序则利用YOLOv9模型进行目标检测,并在图像上标注出目标物体的位置和类别。 通过C# WinForms部署YOLOv9的ONNX模型,我们可以为用户提供一个功能强大的目标检测工具。 性能逆天~,YOLOv9杀疯了!最新的实时目标检测模型!代码已开源!,一款小工具,让你直连谷歌翻译!

    57310编辑于 2025-07-20
  • 来自专栏单细胞天地

    RNAvelocity 9:scVelo应用—动力学模型

    动力学模型 在这里,我们使用通用动力学模型来解释完整的转录动态。 这产生了一些额外的见解,如潜在时间和假定驱动基因的识别。 与以前的教程一样,应用胰腺内分泌发育数据集来展示。 我们运行动力学模型来学习剪切动力的完整转录动力学。 [9]: df = adata.var df = df[(df['fit_likelihood'] > .1) & df['velocity_genes'] == True] kwargs = dict 'degradation rate', xticks=[.1, .4, 1], **kwargs) scv.get_df(adata, 'fit*', dropna=True).head() [9] 潜在时间 动力学模型可恢复细胞过程的潜在时间。这个潜伏时间代表细胞的内部时钟,并接近细胞在分化时所经历的实时,分析仅基于其转录动力学。

    99910发布于 2021-10-09
领券