搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏腾讯开源的专栏
不蒸馏也超强？揭秘端到端文档OCR模型 POINTS-Reader
在端到端方案中，POINTS-Reader提出了一套高度可扩展的数据生成方案，包含两个核心阶段：统一格式预热阶段(Uniform Format Warm-up Stage)和迭代自我改进阶段(Iterative Self-improvement 第二阶段：迭代式自我提升阶段 (Iterative Self-improvement Stage, ISS) 目标是将第一阶段在合成数据上训练的模型，自适应地迁移到真实世界文档上，并持续提升模型和数据质量 Iterative Self-improvement 阶段，过滤的手段至关重要可以发现，在这个阶段对模型生成的数据从各个维度进行过滤，例如表格、公式，可以显著提升数据的质量，从而提升模型的性能。 Iterative Self-improvement 阶段，随着迭代次数多增加，数据的质量和模型的性能也持续提升从上图可以看出，随着迭代的进行，数据的质量在持续的提升（F1-score 不断增加），但是增长的数据变缓了
48110编辑于 2025-09-11
来自专栏OpenClaw系列笔记
OpenClaw 必装的 Skill 底座：从入门到进阶的必备清单
5.自我进化底座：Self-Improvement这是让OpenClaw变得越来越聪明的核心。Self-improvement允许Agent反思自己的执行过程。
64510编辑于 2026-04-09
来自专栏Python进阶之路
OS-Copilot：实现具有自我完善能力的通用计算机智能体
AI 缩小了人类间的知识和技术差距论文标题：OS-Copilot: Towards Generalist Computer Agents with Self-Improvement 论文链接：https
40400编辑于 2024-05-25
大模型“自学”后能力反下降，Llama/Mistral都没逃过
上海交通大学GAIR团队最新研究表明，在常识理解、数学推理和代码生成等复杂任务中，AI经过多轮“自我提升”后，可能会出现一种称为“自我提升逆转”（self-improvement reversal）的现象 Self-Improvement Reversal in Post-training》已获得了 ICML 2024 （AI for Math Workshop）的Honorable Mention Award
38610编辑于 2024-07-22
来自专栏SeanCheney的专栏
《生命3.0》（Life 3.0）序章 Omega团队第1章时代的对话第2章智能的产生
goals are aligned with ours Cyborg —— Human-machine hybrid Intelligence explosion —— Recursive self-improvement
1.7K80发布于 2018-04-24
来自专栏OpenClaw系列笔记
如何优雅地为 OpenClaw 安装 skill 技能包
小生推荐新手必装skill清单包括：self-improvement、tavily-search、skill-vetter、translator、FilesystemManagement，下载地址在这，
3K10编辑于 2026-04-02
来自专栏MixLab科技+设计实验室
AGI倒计时：两年？OpenAI、Anthropic都有类似的观点
这就是传说中的递归自我提升（Recursive Self-Improvement），那个曾经只存在于论文里的“科幻”概念，正在变成现实。
23410编辑于 2026-03-25
来自专栏企鹅号快讯
解密！德扑界的AlphaGo：击败顶级德扑玩家的AI赌神Libratus
模块三：Continual self-improvement（持续自我强化）比赛中人类高手会寻找Libratus的漏洞，并展开有针对性的攻击。
1.1K100发布于 2018-02-11
来自专栏技术汇总专栏
信息论视角下的 AI Agent 主动学习与数据选择策略
在当前的AIAgent（智能体）架构中，模型不再只是被动训练的“黑盒”，而是具备：自主决策（Action）持续学习（ContinualLearning）自我改进（Self-Improvement）的能力
25310编辑于 2025-12-25
来自专栏量子位
德扑人机大战差点没搞成，这是几个你不知道的细节……
Continual Self-improvement（持续自我强化）是冷扑大师背后的核心模块之一。
77350发布于 2018-03-30
来自专栏大数据文摘
大咖丨每年都立下新年Flag的小扎，今年又留给自己什么样的挑战？
This will be a serious year of self-improvement and I'm looking forward to learning from working to fix
44320发布于 2018-05-24
来自专栏测试开发技术
测试开发效率翻10倍！这10款AI Skills神器，我敢说90%的人没用过
Security - [ ] Scan test data for sensitive information - [ ] Verify test environment isolation ### Self-Improvement 4.10 采用渐进式学习 1 2 3 4 第1周: 安装1-2个核心skills (GitHub, HealthCheck) 第2周: 尝试使用,记录反馈第3周: 安装更多skills (Self-Improvement
84310编辑于 2026-04-02
QClaw技多不压身：横向对比四款 AI Agent 平台真实使用感受
但有两块我觉得特别实用：飞书生态最全：9个飞书插件，从日程、任务到多维表格、文档读写，全链路打通写作规划链路完整：从brainstorming→writing-plans→executing-plans→self-improvement
87720编辑于 2026-04-19
来自专栏机器之心
中科大、中兴提出新后训练范式：小尺寸多模态模型，成功复现R1推理
Stage2：拒绝采样自我增强（Rejected Sample based Self-improvement）数据准备过程涉及对综合数据集的系统采样。
34410编辑于 2025-04-15
每周AI论文速递（240415-240419）
Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing 通过想象、搜索和批评实现大语言模型的自我提升尽管大语言模型
18700编辑于 2025-04-08
来自专栏芋道源码
聊聊DeepSeek-R1的技术路径
这一点也基本决定了未来模型的训练中使用优质模型蒸馏的数据集，或模型self-improvement会成为重要的训练路径。
41700编辑于 2025-03-06
来自专栏机器之心
大模型为何难成为「数学家」？斯坦福等揭示严谨证明中的结构性弱点
✨ 曙光初现：批判增强与定理提示可带来性能提升尽管当前模型在逻辑严谨性上的表现仍不理想，扩大模型规模或延长推理过程也难以显著提升推理质量，但研究团队仍发现了一些确实有效的改进策略：自我批判提升（Self-improvement
41710编辑于 2025-06-23
OpenAI与DeepMind竞速 “AI自我进化”，留给人类的控制权还剩多少？
说实话，作为一名长期跟踪AI进化的观察者，我个人觉得，我们可能真的站在了一个名为“递归自我改进”（Recursive Self-Improvement，简称RSI）的悬崖边上。
50910编辑于 2026-02-03
来自专栏量子位
AI赌神称霸德扑的秘密，刚刚被《科学》“曝光”了
模块三：Continual self-improvement(持续自我强化) 比赛中人类高手会寻找Libratus的漏洞，并展开有针对性的攻击。
1K60发布于 2018-03-22
来自专栏机器之心
大模型迎来「开源季」，盘点过去一个月那些开源的LLM和数据集
论文地址：https://arxiv.org/abs/2304.08466 最近的论文《Better Language Models of Code through Self-Improvement》就是关于这一方向的研究
92510编辑于 2023-05-22

第 2 页

不蒸馏也超强？揭秘端到端文档OCR模型 POINTS-Reader

OpenClaw 必装的 Skill 底座：从入门到进阶的必备清单

OS-Copilot：实现具有自我完善能力的通用计算机智能体

大模型“自学”后能力反下降，Llama/Mistral都没逃过

《生命3.0》（Life 3.0）序章 Omega团队第1章时代的对话第2章智能的产生

如何优雅地为 OpenClaw 安装 skill 技能包

AGI倒计时：两年？OpenAI、Anthropic都有类似的观点

解密！德扑界的AlphaGo：击败顶级德扑玩家的AI赌神Libratus

信息论视角下的 AI Agent 主动学习与数据选择策略

德扑人机大战差点没搞成，这是几个你不知道的细节……

大咖丨每年都立下新年Flag的小扎，今年又留给自己什么样的挑战？

测试开发效率翻10倍！这10款AI Skills神器，我敢说90%的人没用过

QClaw技多不压身：横向对比四款 AI Agent 平台真实使用感受

中科大、中兴提出新后训练范式：小尺寸多模态模型，成功复现R1推理

每周AI论文速递（240415-240419）

聊聊DeepSeek-R1的技术路径

大模型为何难成为「数学家」？斯坦福等揭示严谨证明中的结构性弱点

OpenAI与DeepMind竞速 “AI自我进化”，留给人类的控制权还剩多少？

AI赌神称霸德扑的秘密，刚刚被《科学》“曝光”了

大模型迎来「开源季」，盘点过去一个月那些开源的LLM和数据集

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

不蒸馏也超强？揭秘端到端文档OCR模型 POINTS-Reader

OpenClaw 必装的 Skill 底座：从入门到进阶的必备清单

OS-Copilot：实现具有自我完善能力的通用计算机智能体

大模型“自学”后能力反下降，Llama/Mistral都没逃过

《生命3.0》（Life 3.0）序章 Omega团队第1章 时代的对话第2章 智能的产生

如何优雅地为 OpenClaw 安装 skill 技能包

AGI倒计时：两年 ？OpenAI、Anthropic都有类似的观点

解密！德扑界的AlphaGo：击败顶级德扑玩家的AI赌神Libratus

信息论视角下的 AI Agent 主动学习与数据选择策略

德扑人机大战差点没搞成，这是几个你不知道的细节……

大咖丨每年都立下新年Flag的小扎，今年又留给自己什么样的挑战？

测试开发效率翻10倍！这10款AI Skills神器，我敢说90%的人没用过

QClaw技多不压身： 横向对比四款 AI Agent 平台真实使用感受

中科大、中兴提出新后训练范式：小尺寸多模态模型，成功复现R1推理

每周AI论文速递（240415-240419）

聊聊DeepSeek-R1的技术路径

大模型为何难成为「数学家」？斯坦福等揭示严谨证明中的结构性弱点

OpenAI与DeepMind竞速 “AI自我进化”，留给人类的控制权还剩多少？

AI赌神称霸德扑的秘密，刚刚被《科学》“曝光”了

大模型迎来「开源季」，盘点过去一个月那些开源的LLM和数据集

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

《生命3.0》（Life 3.0）序章 Omega团队第1章时代的对话第2章智能的产生

AGI倒计时：两年？OpenAI、Anthropic都有类似的观点

QClaw技多不压身：横向对比四款 AI Agent 平台真实使用感受