这个问题听起来既科幻又有点危险。它指向 AI 圈子里一个长期被搁置的概念——Recursive Self-Improvement(RSI,递归自我改进)。它由 ...
如果你最近关注 AI for Science,多半见过这样一条故事线:从一句研究问题出发,AI 自动查文献、写代码、跑实验、出论文。几分钟一篇 paper,听起...
昨天你刚跟 AI 聊完半小时项目背景,今天重新打开一个新对话框,它又像第一次见你一样,客客气气地问:“请问你的需求是什么?”
AI"奇点"的想象框架长期主导着公众对超级智能的预期:一个单一的硅基大脑自我进化至神级,将所有认知收束为一个冷峻的点。这篇来自 Google、芝加哥大学与圣菲研...
如果你最近关注 Deep Research Agent 领域,MiroThinker-1.7 & H1 这篇技术报告值得认真读一遍。它不是在已有 LLM 外面套...
尽管多模态大语言模型(MLLMs)在离线视频理解基准测试中屡创佳绩,但在诸如直播分析、具身智能机器人、实时安防等连续视频流场景中,它们的表现往往令人大跌眼镜。当...
Deep Research(DR)不是RAG的升级版,它是一种范式转变——LLM从被动的信息消费者变成了主动的研究Agent。 这是我在通读这份综合了10篇核心...
训练工具使用模型时,12k 条高多样性数据能否胜过 48k 条低多样性数据?DIVE 的实验给出了明确答案:可以,而且在分布外(OOD)任务上一致性地更好。这个...
这篇报告解决的问题是:如何在显著更少的训练数据和推理计算开销下,构建一个在数学科学推理与GUI操控上竞争力强的多模态模型。核心贡献是系统化数据质量工程 + 动态...
想象这样一个场景:你花了半小时向 AI 助手解释你的项目架构、编码偏好和团队规范,得到了一次满意的协作体验。第二天你带着新问题回来,它却一脸茫然——"请问您的项...
Kimi K2 是由月之暗面 (Moonshot AI) 推出的万亿参数级混合专家(MoE)大语言模型。
在AI语音合成领域,我们已经习惯了手机导航的清晰指引、智能音箱的简短应答。这些单一、短句的文本到语音(Text-to-Speech, TTS)技术已相当成熟。但...
在过去几年里,我们见证了大型语言模型(LLM)的爆发式增长。从GPT系列到各种开源模型,它们在通用对话、编程、数学解题等领域的能力已经让人叹为观止。然而,AI领...
在AI快速发展的今天,AI Agent(智能代理)已经从概念走向实践,成为连接AI能力与现实应用的重要桥梁。简单来说,AI Agent就像是一个能够自主思考、决...
如何让AI真正学会“使用电脑”?我们已经见证了AI在语言、图像和代码生成领域的惊人成就,但一个看似简单却极具挑战的领域仍然是AI发展的“圣杯”——让AI像人类一...
今天,我们要深入探讨一篇来自字节Seed团队的最新研究——《Pass@k Training for Adaptively Balancing Explorati...
今天,我们要深入探讨一个让AI变得更“懂人情世故”的前沿领域——社交智能。当大语言模型(LLM)从回答事实性问题,走向需要协商、说服、协作的真实社交场景时,我们...
想象一下,如果AI不再仅仅是研究的对象,而是成为研究的主体,能够像人类科学家一样,自主地提出假设、设计实验、编写代码、分析结果,甚至做出超越人类直觉的科学发现,...
Claude Code 里藏着一个超萌的"宠物"功能,它有一个酷炫的名字叫 Buddy,可以理解为你的专属 AI 电子宠物!
对于一款AI Codeing产品来说,最重要的就是Agent设计方法+AI模型,众所周知Claude Code可以说是当前最强的代码编程工具,核心能力就在于优秀...