设计 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签设计

#设计

RSI 递归自我改进：让 LLM 自己来设计下一代的 LLM

唐国梁Tommy 26分钟前2026-06-25 21:45:10

这个问题听起来既科幻又有点危险。它指向 AI 圈子里一个长期被搁置的概念——Recursive Self-Improvement（RSI，递归自我改进）。它由 ...

000

自主科研 AutoResearchClaw ：用五个机制把"流水线"变回了"循环"

唐国梁Tommy 27分钟前2026-06-25 21:43:48

如果你最近关注 AI for Science，多半见过这样一条故事线：从一句研究问题出发，AI 自动查文献、写代码、跑实验、出论文。几分钟一篇 paper，听起...

000

AI Agent 的“记忆革命”来了：真正的分水岭不是模型，而是记忆

唐国梁Tommy 31分钟前2026-06-25 21:39:33

昨天你刚跟 AI 聊完半小时项目背景，今天重新打开一个新对话框，它又像第一次见你一样，客客气气地问：“请问你的需求是什么？”

000

Google研究员发现：DeepSeek-R1内部在"开会"，这才是推理能力的真正来源

唐国梁Tommy 36分钟前2026-06-25 21:34:34

AI"奇点"的想象框架长期主导着公众对超级智能的预期：一个单一的硅基大脑自我进化至神级，将所有认知收束为一个冷峻的点。这篇来自 Google、芝加哥大学与圣菲研...

200

GAIA 榜首，BrowseComp 第一：MiroThinker-H1 如何用核查机制打败 GPT-5 ?

唐国梁Tommy 37分钟前2026-06-25 21:33:59

如果你最近关注 Deep Research Agent 领域，MiroThinker-1.7 & H1 这篇技术报告值得认真读一遍。它不是在已有 LLM 外面套...

300

多模态视频流式推理提效56%：揭秘TWW的分段级动态记忆机制

唐国梁Tommy 38分钟前2026-06-25 21:33:22

尽管多模态大语言模型（MLLMs）在离线视频理解基准测试中屡创佳绩，但在诸如直播分析、具身智能机器人、实时安防等连续视频流场景中，它们的表现往往令人大跌眼镜。当...

000

RL驱动的研究自动化：10篇综述解构Deep Research的技术内核与当前边界

唐国梁Tommy 38分钟前2026-06-25 21:33:14

Deep Research（DR）不是RAG的升级版，它是一种范式转变——LLM从被动的信息消费者变成了主动的研究Agent。这是我在通读这份综合了10篇核心...

100

从搜索循环到 373 种工具：扩展多样性如何重塑智能体训练

唐国梁Tommy 38分钟前2026-06-25 21:33:06

训练工具使用模型时，12k 条高多样性数据能否胜过 48k 条低多样性数据？DIVE 的实验给出了明确答案：可以，而且在分布外（OOD）任务上一致性地更好。这个...

000

微软多模态Phi-4-reasoning-vision-15B：用200B token训出来的多模态推理模型，凭什么敢和1T+对打？

唐国梁Tommy 39分钟前2026-06-25 21:31:30

这篇报告解决的问题是：如何在显著更少的训练数据和推理计算开销下，构建一个在数学科学推理与GUI操控上竞争力强的多模态模型。核心贡献是系统化数据质量工程 + 动态...

000

OpenClaw 记忆系统：AI Agent 如何拥有持久记忆

唐国梁Tommy 54分钟前2026-06-25 21:17:13

想象这样一个场景：你花了半小时向 AI 助手解释你的项目架构、编码偏好和团队规范，得到了一次满意的协作体验。第二天你带着新问题回来，它却一脸茫然——"请问您的项...

000

从万亿基座到智能涌现——KIMI K2 & K2 Thinking 深度解析

唐国梁Tommy 55分钟前2026-06-25 21:16:23

Kimi K2 是由月之暗面 (Moonshot AI) 推出的万亿参数级混合专家（MoE）大语言模型。

000

微软 VibeVoice：迈向超长、高质量、多人的对话语音生成

唐国梁Tommy 1小时前2026-06-25 21:09:24

在AI语音合成领域，我们已经习惯了手机导航的清晰指引、智能音箱的简短应答。这些单一、短句的文本到语音（Text-to-Speech, TTS）技术已相当成熟。但...

300

一文读懂 Intern-S1：为何它能成为科学领域最强的开源多模态大模型？

唐国梁Tommy 1小时前2026-06-25 21:09:18

在过去几年里，我们见证了大型语言模型（LLM）的爆发式增长。从GPT系列到各种开源模型，它们在通用对话、编程、数学解题等领域的能力已经让人叹为观止。然而，AI领...

100

AI Agent 框架大盘点：十大主流框架深度对比与选型指南

唐国梁Tommy 1小时前2026-06-25 21:09:10

在AI快速发展的今天，AI Agent（智能代理）已经从概念走向实践，成为连接AI能力与现实应用的重要桥梁。简单来说，AI Agent就像是一个能够自主思考、决...

000

智谱&清华 ComputerRL 解读：AI Agent学会“使用电脑”的革命性一步

唐国梁Tommy 1小时前2026-06-25 21:00:05

如何让AI真正学会“使用电脑”？我们已经见证了AI在语言、图像和代码生成领域的惊人成就，但一个看似简单却极具挑战的领域仍然是AI发展的“圣杯”——让AI像人类一...

000

从“显式奖励”到“隐式引导”，揭秘字节团队Pass@k训练背后的“接力”策略

唐国梁Tommy 1小时前2026-06-25 20:59:53

今天，我们要深入探讨一篇来自字节Seed团队的最新研究——《Pass@k Training for Adaptively Balancing Explorati...

000

告别奖励黑客：SOTOPIA-RL如何通过多维激励，打造负责任的社交AI

唐国梁Tommy 1小时前2026-06-25 20:58:45

今天，我们要深入探讨一个让AI变得更“懂人情世故”的前沿领域——社交智能。当大语言模型（LLM）从回答事实性问题，走向需要协商、说服、协作的真实社交场景时，我们...

000

自我进化的“AI大脑”，ASI-ARCH系统和它发现的106个“神级”架构全解析

唐国梁Tommy 1小时前2026-06-25 20:57:42

想象一下，如果AI不再仅仅是研究的对象，而是成为研究的主体，能够像人类科学家一样，自主地提出假设、设计实验、编写代码、分析结果，甚至做出超越人类直觉的科学发现，...

200

Claude Code宠物功能揭秘：你的专属 AI 电子宠物 Buddy

老王说技术 1小时前2026-06-25 20:15:11

Claude Code 里藏着一个超萌的"宠物"功能，它有一个酷炫的名字叫 Buddy，可以理解为你的专属 AI 电子宠物！

100

Claude Code源码泄露事件梳理，Agent设计思想以及8大未发布功能曝光！

老王说技术 1小时前2026-06-25 20:14:29

对于一款AI Codeing产品来说，最重要的就是Agent设计方法+AI模型，众所周知Claude Code可以说是当前最强的代码编程工具，核心能力就在于优秀...

200

#设计

RSI 递归自我改进：让 LLM 自己来设计下一代的 LLM

自主科研 AutoResearchClaw ：用五个机制把"流水线"变回了"循环"

AI Agent 的“记忆革命”来了：真正的分水岭不是模型，而是记忆

Google研究员发现：DeepSeek-R1内部在"开会"，这才是推理能力的真正来源

GAIA 榜首，BrowseComp 第一：MiroThinker-H1 如何用核查机制打败 GPT-5 ?

多模态视频流式推理提效56%：揭秘TWW的分段级动态记忆机制

RL驱动的研究自动化：10篇综述解构Deep Research的技术内核与当前边界

从搜索循环到 373 种工具：扩展多样性如何重塑智能体训练

微软多模态Phi-4-reasoning-vision-15B：用200B token训出来的多模态推理模型，凭什么敢和1T+对打？

OpenClaw 记忆系统：AI Agent 如何拥有持久记忆

从万亿基座到智能涌现——KIMI K2 & K2 Thinking 深度解析

微软 VibeVoice：迈向超长、高质量、多人的对话语音生成

一文读懂 Intern-S1：为何它能成为科学领域最强的开源多模态大模型？

AI Agent 框架大盘点：十大主流框架深度对比与选型指南

智谱&清华 ComputerRL 解读：AI Agent学会“使用电脑”的革命性一步

从“显式奖励”到“隐式引导”，揭秘字节团队Pass@k训练背后的“接力”策略

告别奖励黑客：SOTOPIA-RL如何通过多维激励，打造负责任的社交AI

自我进化的“AI大脑”，ASI-ARCH系统和它发现的106个“神级”架构全解析

Claude Code宠物功能揭秘：你的专属 AI 电子宠物 Buddy

Claude Code源码泄露事件梳理，Agent设计思想以及8大未发布功能曝光！

热门专栏

腾讯云中间件的专栏

韩伟的专栏

腾讯云 DNSPod 团队

WeTest质量开放平台团队的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐