Title:VisPlay: Self-Evolving Vision-Language Models from Images Paper:https://arxiv.org/abs/2511.15661 在这样的背景下,研究者开始尝试「自进化」(Self-Evolving)的思路,让模型能通过自我生成、自我修正以及从自身经验中持续学习,从而实现自主的能力迭代。 VisPlay 的核心理念是自我进化(Self-Evolving):它从一个基础预训练 VLM 出发,将其在训练过程中分解成两个相互作用的角色。
将 Hermes 的进化机制提炼成通用 Skill 带着这个目标,我深入研究了 Hermes Agent 的自我进化机制,并将其核心逻辑提炼成了一个「通用 Skill」——「Self-Evolving 封装成独立 Skill」 最后,把这些逻辑封装成一个结构化的 Skill 文档,包含: 核心工作流程 参考资料(决策流程图、格式规范) 质量检查清单 Self-Evolving Skill 的核心设计
它不仅仅教你搭建静态的Agent,还教你如何让Agent在失败中自我改进策略(Self-Evolving)。
二:AI可以从错误中学习 更有意思的是自主演进智能体推理(Self-Evolving Agentic Reasoning)。AI可以通过经验改进自己的表现。
本文通过一张全景技术架构图,系统梳理Agentic Workflow、Multimodal Memory、GraphRAG Router、Self-Evolving Synthetic Data、Neuromorphic 编排层 3.3 组件二:Multimodal Memory记忆层 3.4 组件三:GraphRAG Router检索层 3.5 组件四:Smart Model Router模型路由层 3.6 组件五:Self-Evolving 本节将为你呈现2026年AI技术栈的完整全景图,帮助你建立系统级的技术认知框架: 一张图看懂2026技术栈:Agentic Workflow、Multimodal Memory、GraphRAG Router、Self-Evolving router.estimate_cost(model.name, input_tokens=2000, output_tokens=500) print(f"Estimated cost: ${cost:.4f}") 3.6 组件五:Self-Evolving Synthetic Data数据层 技术定位: Self-Evolving Synthetic Data是Agentic系统的"自我训练数据工厂",通过AI生成高质量合成数据,实现系统的持续自进化。
LLM-Based Autonomous ControlPathWise: Planning through World Model for Automated Heuristic Design via Self-Evolving Vision-Language ModelsOmegaUse: Building a General-Purpose GUI Agent for Autonomous Task ExecutionMetaGen: Self-Evolving
完全自愈、自优化)未来网络具有以下能力:自我感知(Self-Sensing)自我学习(Self-Learning)自我优化(Self-Optimizing)自我修复(Self-Healing)自我演进(Self-Evolving
Empowering AI data scientists using a multi-agent LLM framework with self-evolving capabilities for autonomous
论文标题:JarvisEvo: Towards a Self-Evolving Photo Editing Agent with Synergistic Editor-Evaluator Optimization
Long-Horizon LLM Agentsblock/gooseAgentic Uncertainty QuantificationInference-Time Scaling of Verification: Self-Evolving
对于未来三年,AI软件会走向何方这个现实问题,Bruce Yang 提出,“AI软件未来将朝向‘自我演化(Self-Evolving)’系统发展”,软件开发不再是人写代码,而是构建能自我生成、迭代的软件生态
自进化的用户记忆-让AI Agent在多轮对话中更懂你大概2025年的12月初,最开始这个功能由我提交在DeepResearch项目中,对应的issue self-evolving user role 之所以研究这个主题是因为相信Memory一定会成为AI Agent以后极具区分度的能力,2025年中旬我在日常的上网冲浪中发现学术圈对Memory的研究逐渐开始朝向一个主题,叫Self-evolving 于是我就设计了一种用户角色记忆:让Agent通过主动分析用户的聊天内容,实时、持续地通过多轮对话学习用户的潜在特征,支持在多轮对话中的自进化和更新记忆信息,并利用这些特征指导Agent生成更适合用户的对话内容整体架构Self-evolving
Agent0-VL: Exploring Self-Evolving Agent for Tool-Integrated Vision-Language Reasoning Agent0-VL: 探索用于工具集成视觉语言推理的自进化智能体 这些角色通过自进化推理循环 (Self-Evolving Reasoning Cycle) 相互协作,其中基于工具的验证机制与强化学习共同对齐推理与评估的分布,确保稳定的自我改进。
参考资料 论文:"R-Zero: Self-Evolving Reasoning LLM from Zero Data" https://www.arxiv.org/abs/2508.05004 https
此次 WAIC·AI 开发者论坛上,肖嵘博士将带来《创 “芯” 时代:打造自进化城市智能体》(Building the Self-evolving Intelligent Twins for Cities
好的记忆应该是可以自进化的,self-evolving这个词最近在业界也经常提起,我们可以通过RL算法来实现Memory的自进化。 也可以像DeepResearch一样,做工程侧的self-evolving memory用来引导模型生成适合用户背景的回答。
ReasoningBank: 记忆与推理扩展的完美融合ReasoningBank: Scaling Agent Self-Evolving with Reasoning Memory对比CFGM先离线构建记忆再在在线推理时检索使用
我们的数据集、评估管道和基准结果已开源发布:https://widesearch-seed.github.io/ A Comprehensive Survey of Self-Evolving AI Agents
A Survey of Self-Evolving Agents: On Path to Artificial Super Intelligence 自进化智能体综述:迈向超级人工智能之路 大语言模型(
Enabling Scalable Oversight via Self-Evolving Critic 通过自我进化的批评者实现可扩展的监督 尽管大语言模型 (LLMs) 表现卓越,但其发展面临一个关键挑战 我们提出了 SCRIT (Self-evolving CRITic),这是一个能够实现批评能力真正自我进化的框架。