首页
学习
活动
专区
圈层
工具
发布

#设计

RSI 递归自我改进:让 LLM 自己来设计下一代的 LLM

唐国梁Tommy

这个问题听起来既科幻又有点危险。它指向 AI 圈子里一个长期被搁置的概念——Recursive Self-Improvement(RSI,递归自我改进)。它由 ...

000

自主科研 AutoResearchClaw :用五个机制把"流水线"变回了"循环"

唐国梁Tommy

如果你最近关注 AI for Science,多半见过这样一条故事线:从一句研究问题出发,AI 自动查文献、写代码、跑实验、出论文。几分钟一篇 paper,听起...

000

AI Agent 的“记忆革命”来了:真正的分水岭不是模型,而是记忆

唐国梁Tommy

昨天你刚跟 AI 聊完半小时项目背景,今天重新打开一个新对话框,它又像第一次见你一样,客客气气地问:“请问你的需求是什么?”

000

Google研究员发现:DeepSeek-R1内部在"开会",这才是推理能力的真正来源

唐国梁Tommy

AI"奇点"的想象框架长期主导着公众对超级智能的预期:一个单一的硅基大脑自我进化至神级,将所有认知收束为一个冷峻的点。这篇来自 Google、芝加哥大学与圣菲研...

100

GAIA 榜首,BrowseComp 第一:MiroThinker-H1 如何用核查机制打败 GPT-5 ?

唐国梁Tommy

如果你最近关注 Deep Research Agent 领域,MiroThinker-1.7 & H1 这篇技术报告值得认真读一遍。它不是在已有 LLM 外面套...

100

多模态视频流式推理提效56%:揭秘TWW的分段级动态记忆机制

唐国梁Tommy

尽管多模态大语言模型(MLLMs)在离线视频理解基准测试中屡创佳绩,但在诸如直播分析、具身智能机器人、实时安防等连续视频流场景中,它们的表现往往令人大跌眼镜。当...

000

RL驱动的研究自动化:10篇综述解构Deep Research的技术内核与当前边界

唐国梁Tommy

Deep Research(DR)不是RAG的升级版,它是一种范式转变——LLM从被动的信息消费者变成了主动的研究Agent。 这是我在通读这份综合了10篇核心...

000

从搜索循环到 373 种工具:扩展多样性如何重塑智能体训练

唐国梁Tommy

训练工具使用模型时,12k 条高多样性数据能否胜过 48k 条低多样性数据?DIVE 的实验给出了明确答案:可以,而且在分布外(OOD)任务上一致性地更好。这个...

000

微软多模态Phi-4-reasoning-vision-15B:用200B token训出来的多模态推理模型,凭什么敢和1T+对打?

唐国梁Tommy

这篇报告解决的问题是:如何在显著更少的训练数据和推理计算开销下,构建一个在数学科学推理与GUI操控上竞争力强的多模态模型。核心贡献是系统化数据质量工程 + 动态...

000

OpenClaw 记忆系统:AI Agent 如何拥有持久记忆

唐国梁Tommy

想象这样一个场景:你花了半小时向 AI 助手解释你的项目架构、编码偏好和团队规范,得到了一次满意的协作体验。第二天你带着新问题回来,它却一脸茫然——"请问您的项...

000

从万亿基座到智能涌现——KIMI K2 & K2 Thinking 深度解析

唐国梁Tommy

Kimi K2 是由月之暗面 (Moonshot AI) 推出的万亿参数级混合专家(MoE)大语言模型。

000

微软 VibeVoice:迈向超长、高质量、多人的对话语音生成

唐国梁Tommy

在AI语音合成领域,我们已经习惯了手机导航的清晰指引、智能音箱的简短应答。这些单一、短句的文本到语音(Text-to-Speech, TTS)技术已相当成熟。但...

000

一文读懂 Intern-S1:为何它能成为科学领域最强的开源多模态大模型?

唐国梁Tommy

在过去几年里,我们见证了大型语言模型(LLM)的爆发式增长。从GPT系列到各种开源模型,它们在通用对话、编程、数学解题等领域的能力已经让人叹为观止。然而,AI领...

100

AI Agent 框架大盘点:十大主流框架深度对比与选型指南

唐国梁Tommy

在AI快速发展的今天,AI Agent(智能代理)已经从概念走向实践,成为连接AI能力与现实应用的重要桥梁。简单来说,AI Agent就像是一个能够自主思考、决...

000

智谱&清华 ComputerRL 解读:AI Agent学会“使用电脑”的革命性一步

唐国梁Tommy

如何让AI真正学会“使用电脑”?我们已经见证了AI在语言、图像和代码生成领域的惊人成就,但一个看似简单却极具挑战的领域仍然是AI发展的“圣杯”——让AI像人类一...

000

从“显式奖励”到“隐式引导”,揭秘字节团队Pass@k训练背后的“接力”策略

唐国梁Tommy

今天,我们要深入探讨一篇来自字节Seed团队的最新研究——《Pass@k Training for Adaptively Balancing Explorati...

000

告别奖励黑客:SOTOPIA-RL如何通过多维激励,打造负责任的社交AI

唐国梁Tommy

今天,我们要深入探讨一个让AI变得更“懂人情世故”的前沿领域——社交智能。当大语言模型(LLM)从回答事实性问题,走向需要协商、说服、协作的真实社交场景时,我们...

000

自我进化的“AI大脑”,ASI-ARCH系统和它发现的106个“神级”架构全解析

唐国梁Tommy

想象一下,如果AI不再仅仅是研究的对象,而是成为研究的主体,能够像人类科学家一样,自主地提出假设、设计实验、编写代码、分析结果,甚至做出超越人类直觉的科学发现,...

000

Claude Code宠物功能揭秘:你的专属 AI 电子宠物 Buddy

老王说技术

Claude Code 里藏着一个超萌的"宠物"功能,它有一个酷炫的名字叫 Buddy,可以理解为你的专属 AI 电子宠物!

100

Claude Code源码泄露事件梳理,Agent设计思想以及8大未发布功能曝光!

老王说技术

对于一款AI Codeing产品来说,最重要的就是Agent设计方法+AI模型,众所周知Claude Code可以说是当前最强的代码编程工具,核心能力就在于优秀...

000
领券