首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Karpathy 的 2026 AI 判断:锯齿智能与人类理解的护城河

Karpathy 的 2026 AI 判断:锯齿智能与人类理解的护城河

作者头像
mixlab
发布2026-05-06 14:05:12
发布2026-05-06 14:05:12
1920
举报
封面图片
封面图片

Andrej Karpathy 在 Sequoia Ascent 2026 的对谈中反复强调:LLM 的价值不在"加速旧事物",而在"让新事物第一次成立"停止写代码后,他发现了什么???

他用 Menu Gen 案例说明:上传菜单照片,让模型把菜品图片覆盖到原菜单上——直接出结果。OCR、检索、渲染,这些中间层全部蒸发。大量 AI 应用不过是模型缺陷的临时包装,模型一进步,中间层就消失。

所以,不是用 AI 提速一个业务流程,而是直接做端到端的流程。

锯齿智能:为什么 AI 既超级聪明又显得很蠢

Karpathy 在 2024 年 7 月首次提出"锯齿智能"概念,2026 年在 Sequoia 大会上进一步扩展了这个框架。

锯齿智能:意思是 AI 的能力发展不均衡,像锯齿一样有的地方突然很厉害,有的地方还很菜。
锯齿智能:意思是 AI 的能力发展不均衡,像锯齿一样有的地方突然很厉害,有的地方还很菜。

核心观点:模型能力从来不是爬坡,而是山地:有的地方突然登顶,有的地方还在山脚。

他用两个因素解释这个现象:

第一,可验证性。 就是"输出对不对,能快速判断吗"。代码、数学、博弈任务容易判断对错,模型在这些领域强;常识推理、模糊判断难以验证,模型在这些领域弱。

简单理解:AI 考试能自动批卷的领域它很强,需要靠人判断好坏的领域它很弱。
简单理解:AI 考试能自动批卷的领域它很强,需要靠人判断好坏的领域它很弱。

例如:同一个大语言模型能连贯地重构 10 万行代码库,同时又建议你"去洗车场洗车":两个任务能力差距天壤之别。

第二,经济学因素。 市场大小决定了前沿实验室愿意把哪些领域优先喂给模型训练。热门赛道飞速前进,冷门领域用砍刀开路。

类比:补课班只押高考题库,不会覆盖所有知识点——出题的人和教课的人精力都有限。
类比:补课班只押高考题库,不会覆盖所有知识点——出题的人和教课的人精力都有限。

NYT 给这种思路起了个名字:《"锯齿智能"如何重新定义 AI 辩论》。说白了:为什么 AI 什么都懂又什么都蠢,这就是答案:不是 bug,是两个因素叠加出来的结构问题。

可验证性:AI 创业的最大杠杆

Karpathy 的建议很务实:

AI 创业不是找"AI 替代不了"的行业,而是找"还没被喂进训练数据"的问题。

核心在于:一个问题能产出明确反馈,就能砸强化学习资源做微调,看到实际收益。可验证性是当前 AI 最好用的杠杆。一个领域如果很难判断输出对错,AI 短期根本攻不进去。

所以,"AI 能做什么"不是玄学,是可操作的市场分析框架。YC Summer 2026 信号

.md 技能取代命令行安装

Karpathy 抛出第二个判断:未来最重要的软件接口可能不是图形界面,也不是编程接口,而是可被模型读懂的文本

图形界面(GUI)= 你点按钮操作电脑; 编程接口(API)= 你写代码调用服务; 可读文本 = 你直接说话, 模型自己理解要做什么。
图形界面(GUI)= 你点按钮操作电脑; 编程接口(API)= 你写代码调用服务; 可读文本 = 你直接说话, 模型自己理解要做什么。

具体来说:

  • .md 技能文件 = 安装说明 = 执行指令
  • 大语言模型 = 高级英文解释器,能智能适配你的环境
  • 安装过程的调试全部内联完成

软件分发的最小单位从"可执行指令"变成"写给 Agent 的自然语言说明"。语言本身成了执行层。

对开发者的直接冲击:不用再写 pip install xxx 和配置文件了,写一个 .md 文件,让模型自己搞明白要做什么、怎么适配你的环境。

范式转变。

智能体工程:新职业的方向

Karpathy 认为未来产品由三块组成:

传感器 = 相当于人的眼睛和耳朵,感知环境 执行器 = 相当于人的手和脚,作用于真实世界 逻辑 = 相当于人的大脑,做决策控制
传感器 = 相当于人的眼睛和耳朵,感知环境 执行器 = 相当于人的手和脚,作用于真实世界 逻辑 = 相当于人的大脑,做决策控制

真正的"智能体原生"标准:人类只要给个提示词(比如"搭个 Menu Gen"),智能体就能自己搞定服务关联、DNS 配置然后上线。

他给这种工作起了个名字:智能体工程(Agentic Engineering)。核心能力是组织多个智能体配合完成复杂任务。招人标准也在变:不看算法题了,看你能不能用智能体把真实项目做出来。

他还做了个激进推演:未来神经网络可能包揽大部分计算,CPU 退居辅助。

这个判断如果成立,"编程"这件事的定义就彻底变了。软件交互范式的根本转变

人类剩下什么?

Karpathy 最后说了一句值得思考的话:

你可以外包你的'思考',但你不能外包你的'理解'。

模型能生成方案、比较选项、执行流程、甚至替你写东西和推理。但它没法替你做真正的理解:什么重要,什么真实,什么值得追求,什么风险可接受。人还是需要一些东西来指导思考和处理,而这个能力的天花板就是你的"理解"。

所以他疯狂建个人知识库、Wiki 系统。个人wiki构建

正因为理解没法外包,他才会说"作为程序员我从来没这么落后过",他正在成为自己认知的瓶颈。

2026 年,这个判断很扎心。

Agent 能做的事越来越多,理解自己在做什么成了人类最后一道护城河。

你今天建自己的知识库了吗?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 无界社区mixlab 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 锯齿智能:为什么 AI 既超级聪明又显得很蠢
  • 可验证性:AI 创业的最大杠杆
  • .md 技能取代命令行安装
  • 智能体工程:新职业的方向
  • 人类剩下什么?
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档