首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏机器学习算法与Python学习

    开源星际争霸2智能挑战smac

    转自:专知 SMAC是Github上的一个用于在暴雪星际争霸2上进行智能体协同强化学习(MARL)的环境。 SMAC用了暴雪星际争霸2的机器学习API和DeepMing的PySC2智能与星际争霸2的交互提供了友好的接口,方便开发者观察和执行行动。 https://github.com/oxwhirl/smac 安装SMAC pip install git+https://github.com/oxwhirl/smac.git 另外,星际争霸2也是要安装的 示例代码 ---- 在下面的代码中,独立的智能在接收到观察和全局状态后会执行随机策略。 from smac.env import StarCraft2Env import numpy as np def main(): env = StarCraft2Env(map_name=

    1.6K20发布于 2019-03-07
  • 来自专栏测试开发囤货

    MetaGPT:智能元编程框架

    MetaGPT:智能元编程框架 使 GPTs 组成软件公司,协作处理更复杂的任务 MetaGPT输入「一句话的老板需求」,输出「用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等 并使用npm安装mermaid-js npm --version sudo npm install -g @mermaid-js/mermaid-cli # 第 2 步:确保您的系统上安装了 Python

    92630编辑于 2023-08-08
  • 智能架构的核心功法

    这让我意识到:智能不是技术升级,而是组织升级。 智能不是简单叠加,而是化学反应 很多人听到"智能",第一反应是"不就是调用几个AI接口吗"。这种理解太表面了。 这些问题解决不好,智能就会从"提升效率"变成"增加负担"。 企业落地的三个关键门槛 经过两年的实践,我总结出企业落地智能的三个关键门槛: 第一个门槛:找到合适的分工边界 不是所有业务都适合用智能。有些场景用单体AI更高效,有些场景必须用智能。 如果任务相对简单且变化不大,单体AI足够;如果任务复杂且经常变化,智能的优势就体现出来了。 对于企业来说,关键不是要不要用智能,而是什么时候用、怎么用、用在什么地方。 我们的经验是:从简单场景开始,逐步复杂化;从单体AI开始,逐步智能化;从技术验证开始,逐步业务化。

    15610编辑于 2026-02-02
  • 来自专栏张善友的专栏

    OpenAI官方开源智能框架「Swarm」,并不是我想要的智能框架

    今天早上,OpenAI实施团队的 @shyamal在Github上开源了Swarm这个OpenAI官方的智能框架。 这个智能框架确实已经把智能的关键,说的很透彻了,Swarm 里面定义了两个核心「Agents」和「Handoffs」,智能的核心是在这个Handoffs上面。 个人观点认为他的设计还没有我们的智能框架好用,OpenAI的[Swarm]是docker swarm,我们的智能框架就是k8s,我需要的是像k8s编排容器那样编排智能,我们刚刚在9月26日对外发布了智能的工业设计产品 智能的核心难题其是不同智能之间的通信问题。怎麼传递信息,传哪些信息,这些都很重要。多个智能体协作,也只需要在必要的时候被调用起来就可以了。 OpenAI的Swarm 目前还处于实验阶段,期望他发展成为k8s 这样的一个智能编排框架: 这个框架是python写的,大家觉得用python 写智能应用是好选择吗?

    60910编辑于 2025-02-04
  • 来自专栏大模型应用开发

    Data Agents-Part 2 :揭秘 AI 量产关键:智能编排

    定制化AI系统开发全流程:智能编排才是量产关键在定制化AI系统的完整生命周期里,咱们一般会按三步走来:基于现成的预训练大模型(比如GPT-5、Claude这类狠角色)针对特定领域任务做微调结合真实业务场景的反馈 ,用强化学习打磨效果但要把模型的“蛮力”转化为能落地的产品,还得补上第四步——智能体协同编排。 一套极简的智能架构我们采用的是分层架构,各司其职、分工明确:规划师(Planner):把用户的原始需求,拆解成一步步能执行的原子任务调度器(Executor):决定下一步该执行哪个任务、要不要重新规划 2. regulations",    "enabled_agents": ["web_researcher", "synthesizer"],}graph.invoke(state)编排层才是量产的关键这套智能编排层

    40210编辑于 2025-12-20
  • 来自专栏数据科学和人工智能

    DeepMind 最新教程:智能学习

    DeepMind团队最新做的关于智能学习的教程 DeepMind团队最新做的关于智能学习的教程

    71610编辑于 2022-03-31
  • 来自专栏AI智能体从入门到实践

    构建AI智能:Agent2Agent智能体系统:基础通信与任务协作实现

    ​一、基本概述 Agent2Agent(A2A)是一个专注于智能间通信、协作与协调的框架,旨在促进多个智能(Agent)之间的通信与协作。 A2A框架提供了标准化的通信协议、消息传递机制和协作模式,使智能体能够像人类团队一样协同工作,解决单个智能难以处理的复杂问题。二、智能的特征和类型1. 智能的特征智能是A2A框架中的基本单位。 框架通信示例 示例实现一个简单的Agent2Agent通信框架,展示了智能体系统的基本工作原理。 : 智能 worker_2 已注册 智能初始化: 数据分析师 (ID: worker_2) 传输层: 智能 worker_3 已注册 智能初始化: 技术作家 (ID: worker_3) 管理器处理了 8 条消息 完成了 1 个跨领域任务八、应用场景复杂问题求解:多个专业智能体协作解决单一智能难以处理的复杂问题分布式系统管理:智能体协同管理分布式资源和服务模态AI系统:不同模态的

    1.7K21编辑于 2025-12-09
  • 2026 年智能架构综述:从笨重设计到智能架构(MAS)

    如果把 2024 年比作智能的“前哨战”,那么 2026 年就比作真正生产级智能的“分水岭”。 取而代之,是像微服务演进同样必然的范式:智能体系统(Multi-Agent System, MAS)。01 笨重设计的最终路:为什么分离剂玩不动了?在早期探索中,我们习惯于构建“全能型智能”。 设计模式在处理简单的演示时表现出色,但在真实的企业级场景(如复杂的金融审计、供应链调度)中却暴露了三个致命伤:认知的“过度过度”:当一个智能被要求同时掌握代码编写、合规审核和风险评估时,LLM 的长上下文 专家、景观设计师、创意专家……这些子智能实时同步进度,形成了一个“永不掉链子”的协作环。 这就是 2026 年的现实:人工智能不再是一个查询工具,正在成为企业的操作系统(Agent OS)。 随着模型上下文协议(MCP)等协议的成熟,智能之间的协作负载已经成为冰点。 如果你还在尝试用一个庞大的提示解决所有问题,那么现在就停下来重新思考架构的时候了。

    42432编辑于 2026-01-20
  • 来自专栏AgenticAI

    LLM智能AutoGen教程2 顺序对话:登机服务

    智能AutoGen教程1:让两个LLM Agent给我说相声》之后,我们已经介绍了AutoGen中ConversableAgent的基本概念和用法,相信你已经学会如何发起一个对话或者两两对话。 智能AutoGen教程1:让两个LLM Agent给我说相声》。 1. 2. 总结 本文以登机服务为例,讲解了如何使用AutoGen实现智能体协作的登机服务,人类如何无缝介入,总结如何设计,顺序通信如何设计,对话摘要结转(carryover)的原理。 通过深入分析和解决实际操作中遇到的挑战,有助于读者加深对智能顺序对话系统设计的理解和实施能力。 下一篇,我们将尝试使用AutoGen中构建智能的群聊功能,仍然会以一个有趣的应用展开。

    44800编辑于 2025-03-18
  • 智能一致性算法

    所有智能的某个状态量(位置、速度、成本等)通过 局部邻居通信 最终收敛到同一个值。 二、1-D 离散时间一致性(5 行 MATLAB 代码)% 一阶离散一致性N = 5; % 智能个数A = [0 1 1 0 0; % 邻接矩阵 (无向图) 1 0 1 1 0; 1 1 0 1 1; 0 1 1 0 1; 0 0 1 1 0];L = diag(sum(A,2)) - A; % 拉普拉斯矩阵 五、Simulink 快速搭建打开 cons_quad.slx 在 Mask 里选择拓扑: topology='ring', order=2 运行 → Scope 显示 5 架无人机 x 坐标 10 、性能指标 & 评价函数function J = itae_cons(t,x)J = trapz(t,abs(x - mean(x(1,:))));end对比结果: 1 阶:ITAE = 4.2 2

    24510编辑于 2025-09-02
  • 来自专栏panzhixiang

    大模型智能简单应用案例介绍

    智能角色的说明 最近在尝试 LLM Multi Agent(智能)的应用场景,下面给一个最近觉得还比较好用,也不是很麻烦的案例。 llm_config_deepseek = { "model": "deepseek-chat", "api_key": "sk-bbd9c7ce03e247a099e3c0506aa2a0ea 或者 3,设置 1 的话效果一般没有 2 好,大于3的话又显得太繁杂了。 问题诊断 - 症状分析和分类 - 初步影响评估 - 可能的根因列表 - 需要收集的额外信息 2. 问题分析 - 根因定位方法 - 影响评估报告 2. 技术方案 - 自动化实现代码 - 监控集成方案 - 验证测试方法 3.

    83010编辑于 2025-02-11
  • 来自专栏AI

    VSCode 正式发布:全新智能开发平台

    VSCode在2026年2月发布的1.109版本中,正式将智能开发体验提升到新高度:在单一编辑器内运行Copilot、Claude与Codex智能,统一管理所有会话,为每个任务选择最合适的工具。 一、统一的智能体会话管理:AgentSessions视图智能开发的核心挑战在于会话管理。 :研究型子智能:只读权限+网络搜索工具实现型子智能:完整编辑权限安全审计子智能:专注漏洞扫描的专用提示词四、开放标准:MCPApps与AgentSkillsVSCode的智能战略不仅关注功能集成 标志着智能开发体验的重要转折点:开发者无需在不同工具间切换,也无需为每个新智能体重新学习工作流。 通过统一的会话管理、开放的标准支持与灵活的编排能力,VSCode正在成为智能时代的开发者首选平台。

    43110编辑于 2026-02-14
  • 来自专栏强化学习专栏

    【MADRL】智能深度强化学习《纲要》

    文章强化学习: 强化学习(3)---《【MADRL】智能深度强化学习《纲要》》 【MADRL】智能深度强化学习《纲要》 智能深度强化学习(Multi-Agent Deep 智能深度强化学习将深度学习与智能强化学习结合,使得智能体能够在复杂、高维的环境中学习到有效的策略。 背景与挑战 智能体系统中的强化学习任务包含多个智能,每个智能在与环境和其他智能的交互过程中不断学习。 智能之间的协作与竞争:不同智能可能有协作、竞争或混合的关系,这使得策略学习需要 考虑复杂的相互依赖关系。 2. MADRL 的基本架构 MADRL 算法大体上可以分为以下几类: 2.1. 尽管简单易实现,但这种方法在智能环境中容易陷入非平稳性问题,且无法有效处理智能之间的协作。 2.2.

    1.3K10编辑于 2024-12-03
  • 智能仓库AI指挥层技术架构

    智能仓库AI指挥层实现运营卓越与供应链智能仓库的“大脑”:解决碎片化运营难题尽管仓库的自动化和数据丰富程度已达历史新高,但多数站点仍然依赖一套难以跟上节奏的系统:仓库管理系统(WMS)、少量仪表盘和分散的岗位知识 主管们需要管理12类以上的设备、数千个班次任务以及持续不断的数据流,却没有任何统一的智能系统来解读全局或指导下一步行动。本文介绍智能智能仓库(MAIW)蓝图——一个缺失的关键层。 设计目标:展示某机构AI技术栈(包括NIM、NeMo、cuML、cuVS)如何驱动运营助手提供镜像仓库角色的智能架构:设备、运营、安全、预测、文档处理将检索增强生成(RAG)、预测和文档AI统一到单一工作流内置真实的安全性 推理层:LLM NIM驱动智能核心——Llama 3.3 Nemotron Super 49B处理复杂运营决策,Nemotron Nano 12B v2 VL提供文档和图像的视觉语言理解。 智能功能规划与通用路由意图、分解任务、选择合适智能设备与资产跟踪管理叉车、AMR、传送带;检查遥测、维护和利用率运营协调管理任务、波次、人员配置和KPI;诊断瓶颈并执行修复安全与合规强制执行SOP和法规

    12210编辑于 2026-04-05
  • 来自专栏强化学习专栏

    【MADRL】智能价值分解网络(VDN)算法

    文章分类在强化学习专栏: 【 强化学习】(11)---《智能价值分解网络(VDN)算法》 智能价值分解网络(VDN)算法 1.算法介绍 智能强化学习(MARL, 在智能体系统中,每个智能不仅需要根据自己的观察做出决策,还需要与其他智能体协作以实现全局目标。 2.VDN 算法概述 VDN算法的核心思想是将多个智能的 联合Q值函数 分解为 每个智能的局部Q值之和。 2.1价值分解 在传统的单智能强化学习中,Q值函数 表示在状态 下采取动作 的价值。对于智能体系统,联合Q值函数 表示在状态 下所有智能联合动作 的总价值。 分散执行:每个智能只需根据自己的局部观察和Q值进行决策,不依赖其他智能的具体动作,适用于具有局部观测的智能任务。

    1.3K00编辑于 2024-12-03
  • 来自专栏NLP/KG

    【一】MADDPG-单智能|智能体总结(理论、算法)

    产生问题: 1–传统的智能RL算法中,每个智能走势在不断学习且改进其策略。由此,从每个智能的角度来看,环境是不稳定的,不利于收敛。 而传统的单智能强化学习,需要稳定的环境 2–由于环境的不稳定,无法通过仅改变智能本身的策略来适应动态不稳定的环境。 3–由于环境的不稳定,无法直接使用经验回放等DQN技巧。 ---- 2.智能 (转) 1-如图所示,智能体系统中至少有两个智能。另外,智能之间存在着一定的关系,如合作关系,竞争关系,或者同时存在竞争与合作的关系。 每个智能最终所获得的回报不仅仅与自身的动作有关系,还跟对方的动作有关系。 2-智能强化学习的描述:马尔可夫博弈。状态转换符合马尔可夫过程,关系符合博弈。 可以表示为<N,S,A,Ri,T>,其中,N表示的是智能的集合,S表示的是环境的状态空间、Ai表示的是智能i的动作空间,A=A1A2…An表示为联合动作,R表示智能i的奖励,T为状态转换函数。

    4.9K20编辑于 2022-12-01
  • 来自专栏玩转全栈

    智能 MetaGPT 2 分钟上线需求,极致工程化!

    这不仅能解决单一任务的实现问题,还能够通过多智能的协作,处理更复杂、更高级的开发需求。

    3K41编辑于 2024-06-03
  • 来自专栏AgenticAI

    实战OpenAI最新开源智能框架Swarm

    所以,Swarm 是一个智能框架。 OpenAI 声明了这只是探索性的一个框架,并不打算完善上生产,主要目标是为了演示 OpenAI 官方教程《智能编排:路由与交接(Orchestrating Agents: Routines and 按照我的理解智能为大语言模型的 Agent 系统引入了分工合作、专人专事的思路,可以用来实现工作流类型的应用。通过给不同的 Agent 设定特定的 Prompt,能够让他们更精确的完成任务。 虽然 OpenAI 的 Swarm 只是 Demo,但其简洁的实现,能够让我们快速了解智能。 1. 参考资料 [1] Swarm: https://github.com/openai/swarm [2] 智能编排:路由与交接(Orchestrating Agents: Routines and Handoffs

    1K10编辑于 2025-03-18
  • 来自专栏phodal

    Shire 智能市场:IDE 一键安装智能,协同打造集体智慧 Copilot

    太长不看版:在新版本(0.8)的 Shire 中,你可以通过 Shire 智能市场,一键下载和安装多个智能,并直接在你的当前项目中使用。 与此同时,你还可以 将你的 Shire 代码段或者智能上传到 Shire 智能市场。 详细见视频: WHY:AI 智能应用于真实世界软件开发的挑战? 基于团队的流程、规范,来编写生成代码、生成测试用例等智能。 通过智能市场,来下载、安装、使用团队的智能。 通过将团队的知识与代码库、团队上下文等紧密结合,我们可以实现更高效的软件开发。 方式 2:Shire 智能市场 Shire 智能市场本质是利用 Shire 抽象 IDE 的底层能力,将与 IDE 交互、软件开发的操作,提取为一个个原子能力,诸如于:函数、变量、代码模型等。 其它 Shire 新功能 在新版本(0.8)的 Shire 中,你还将体会到: model 参数,用于在 Shire 代码中指定模型的名称,以支持模型的调用。

    25700编辑于 2024-11-22
  • 来自专栏DeepHub IMBA

    ADK 智能编排:SequentialAgent、ParallelAgent 与 LoopAgent 解析

    单个智能的专业化程度有上限,真正的工作需要团队:一个角色接收订单,一个检查库存,一个安排生产,一个验证质量。 ADK 的编排模式:SequentialAgent、ParallelAgent、LoopAgent可以将多个智能组合成工作流,流程只定义一次,状态在智能之间自动传递,故障由系统托管。 它为每个智能的输出命名,后续智能体用 {placeholder} 语法引用,ADK 自动完成状态传递。 模式 2:ParallelAgent——部门协作 多个独立任务可以同时推进时适用。 状态管理:数据在智能之间的流转 这是整个编排机制的核心。ADK 依靠 output key 和占位符语法自动完成状态传递。

    11610编辑于 2026-04-15
领券