首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >提示词工程简史:一群普通人如何发现"唤醒"AI 的钥匙

提示词工程简史:一群普通人如何发现"唤醒"AI 的钥匙

原创
作者头像
卢旺
发布2026-06-20 21:25:31
发布2026-06-20 21:25:31
1340
举报

提示词工程的故事,是一个问题逐渐被回答的过程:AI 身上那些惊人的能力,到底是需要重新训练才能获得,还是一直在那里,只是等人找到正确的方式去唤醒它?


引子

2022 年,东京大学一个叫 Kojima 的博士生在实验室里随手敲下一句话:

"Let's think step by step."(咱们一步步想。)

他把它塞进一个大语言模型的输入框,没抱什么希望。结果让他愣住了——模型做数学题的准确率从 17% 直接跳到了 78%。

能力一直在模型里。只是之前没人知道怎么把它叫出来。

这就是提示词工程(Prompt Engineering)要解决的问题。

提示词工程,说白了就是:怎么跟 AI 说话,才能让它给出你真正想要的答案。 它不是编程,更像是写说明书——只不过收件人是个能读字的机器。你说得清楚,它就答得明白;你说得含糊,它就开始瞎编。


一、萌芽:能听懂,但"听不听话"(2020)

在 GPT-3 出现之前,想让 AI 学会一个新任务,你得收集大量标注数据,对它进行微调(fine-tuning)。这就像每换一道菜就得重新备料、调整火候——只有大公司和顶级实验室才玩得起。

2020 年 5 月,OpenAI 发布了 GPT-3,一个拥有 1750 亿参数的巨型模型。论文标题直接点明了它的核心能力:"Language Models are Few-Shot Learners"——翻译过来就是:你不用专门微调,给它看几个例子,它当场就能完成新任务。

这项能力后来被称为"上下文学习"(in-context learning)。打个比方:你给一个新员工一份现场操作手册,他照着做就能完成任务——但这不意味着他"学会"了这个技能,他只是临时参考了你给的信息。GPT-3 也是如此:模型的参数没有改变,它只是在你给的例子里找到了模式来指导本次回答。

但一个问题也随之而来:同样的任务,换一种说法,AI 的表现天差地别。

"请总结这篇文章"和"请用三句话概括这篇文章的核心观点",得到的答案质量完全不同。AI 确实能听懂人话了——但"听不听话",全看你怎么说。


二、突破:一句话改变一切(2022)

2022 年发生了三件事。它们加在一起,把提示词从一个实验室技巧变成了每个人都能用的工具。

拐点一:Chain-of-Thought(2022 年 1 月)

Google 的研究团队做了一件事:他们在给 AI 看例题的时候,不光告诉它答案,还手写了中间每一步的推理过程。论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》(思维链提示激发大语言模型的推理能力)显示,这种方法让 AI 在复杂数学和逻辑题上的准确率大幅提升。

思路很简单:你不是让 AI 直接猜答案,而是给它示范"怎么想"。效果很震撼。

拐点二:Kojima 的发现(2022 年 5 月)

如果说 Chain-of-Thought 是给了 AI 一本"思考说明书",Kojima 的发现则更惊人——你根本不需要写说明书。加一句话就够了。

Kojima 后来回忆发现过程时是这么说的:

"一开始我们试图人工设计复杂的推理格式……但尝试了各种想法都失败了。当没什么可试的时候,我想与其让人来设计复杂的思考过程,不如让 LLM 自己来想,'Let's think step by step' 这句话突然浮现在脑海中,试了一下没抱希望,结果居然有用(笑)。"

来看看这句话到底有多大的魔力:

任务

标准提示

加上"Let's think step by step"

MultiArith(算术推理)

17.7%

78.7%

GSM8K(小学数学题)

10.4%

40.7%

Coin Flip(硬币翻转推理)

12.8%

91.4%

Date Understanding(日期逻辑)

49.3%

67.5%

Coin Flip 那一行尤其说明问题:从"基本不会"到"几乎全会",中间只隔了一句话。(数据来源:Kojima et al., 2022, Table 1)

这篇论文《Large Language Models are Zero-Shot Reasoners》截至 2024 年 5 月已被引用超 2000 次,此后持续快速增长,是提示词工程领域被引用最多的论文之一。

拐点三:ChatGPT 上线(2022 年 11 月)

11 月 30 日,OpenAI 把 ChatGPT 放到了网上。两个月内用户破亿。

在这之前,"提示词工程"是挂在 arXiv 论文里的术语。在这之后,它变成了无数普通人在对话框里摸索的事情。你不需要懂机器学习,不需要会写代码——你只需要打字。

这三个事件加在一起,完成了一件事:提示词从研究人员的秘密武器,变成了任何人的日常对话。


三、爆发:提示词成为一门显学(2023)

2023 年,"提示词工程师"成了科技圈最热门的词之一。

Anthropic(OpenAI 的竞争对手)开出了 17.5 万到 33.5 万美元的年薪招聘这个岗位,引发全网热议。据 Indeed Hiring Lab 数据,招聘网站上"Prompt Engineer"的搜索量从 2023 年 1 月的每百万次搜索中只出现 2 次,飙升到 4 月的 144 次,涨了 70 多倍。

与此同时,社区开始自发总结各种"咒语指南"。GitHub 上的 awesome-chatgpt-prompts 项目成为热门资源库,吴恩达(Andrew Ng)通过 DeepLearning.AI 与 OpenAI 合作推出了课程《ChatGPT Prompt Engineering for Developers》,推动系统化学习。常见技巧被归纳为几大类:

技巧

通俗解释

例子

角色扮演

给 AI 一个身份,它会在那个身份下思考和回答

"你是一名资深产品经理,请评估以下需求……"

思维链

让 AI 展示推理过程,而不是直接给结论

"先列出关键因素,再逐一分析,最后给出建议。"

Few-shot 示例

给 AI 看一到两个你满意的答案范例

"以下是我想要的回答风格:[示例],请按这个风格回答:"

ReAct

让 AI 推理与行动交替:思考→行动→观察结果→再思考

"请搜索相关资料,根据结果分析,若信息不足则补充搜索,最后给出结论。"

但这些技巧有一个共同的"软肋":它们高度依赖于你用的是哪个模型。 换一个版本、换一家公司的模型,同样的"咒语"可能就失灵了——就像给南方人解释东北话的梗,对方可能完全 get 不到。


四、工具进化:提示词不再靠手写(2024)

2024 年,风向变了。

OpenAI 在 9 月发布了 o1 推理模型——它在回答之前会自动进行内部推理(虽然这个过程对用户不可见),效果上相当于模型自己会"思考"了,不再需要你在提示词里手把手教它怎么一步步想。

这一变化引发了一个流传很广的观点:"提示词工程师是世上最短命的职业。" Indeed 上相关岗位的搜索量回落到了每百万次 20 到 30 次。微软 2024 年工作趋势指数报告也显示,"提示词工程师"是企业最不愿新增的岗位之一。

但事情的另一面也在悄然发生:让程序自动搜索最优提示词,而不是人手工一遍遍地试。

斯坦福大学推出了 DSPy 这样的框架,Anthropic 发布了 Prompt Improver 工具——它能自动分析和优化你的提示词,帮你把一段含糊的指令改写成更清晰、更有效的版本。Google 也发布了面向开发者的提示设计指南,尝试把这件事系统化。

我们可以用一个通俗的类比来理解这个转折:

过去写提示词像"炒菜凭手感"——老师傅知道什么时候该下盐,但说不出具体克数。到了 2024 年,这个领域有了"菜谱和量杯"——过程可以复现,结果可以验证。

维度

2022-2023

2024 之后

谁来决定提示词?

人手工编写,反复试

程序自动搜索最优组合

怎么验证效果?

逐条尝试,凭经验和直觉

系统化 A/B 测试,数据驱动

对普通用户意味着什么?

你需要学会"咒语"、记模板

你只需要说清楚你要什么

这件事的本质是:提示词工程正在从一门"玄学手艺"变成一项"工程实践"。 它不再是你有多懂 AI 的较量,而是你有多懂自己需求的镜子。


五、回归本质:和 AI 沟通这件事不会变

提示词工程的工具和技巧在四年里换了好几轮,但有一件事从 2022 年到现在从来没变过:你仍然需要把自己的模糊想法,变成一个 AI 能执行的清晰指令。

这件事和写需求文档、和同事对齐目标没有本质区别——都需要你把背景、边界、期望说清楚,把暗示变成明说,把模糊变成具体。

在 AI 逐渐渗透进每一个工作岗位的时代,会和机器高效沟通这件事,正在像打字一样,从一项专业技能变成一项基础能力。 四十年前,"会打字"是简历上亮眼的加分项;今天,你不会打字几乎没法工作。也许十年后,"会跟 AI 说清楚话"也会是同样的处境。

回到开头的 Kojima。

那句话 "Let's think step by step" 之所以被记住,不是因为它是一句神奇咒语——事实上,随着模型越来越聪明,这句话的作用正在减弱。它之所以重要,是因为它说明了一件更本质的事:

你不需要成为 AI 专家,你只需要学会把话说清楚。

这大概是提示词工程走了四年之后,留给我们最朴素、也最重要的结论。


本文基于公开论文、行业报告和开发者社区记录整理。关键数据来源:Wei et al. (2022, arXiv:2201.11903); Kojima et al. (2022, arXiv:2205.11916); 东京大学松尾研究室 Kojima 采访(2024.6, weblab.t.u-tokyo.ac.jp); OpenAI GPT-3 技术报告; Indeed 招聘趋势数据。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 引子
  • 一、萌芽:能听懂,但"听不听话"(2020)
  • 二、突破:一句话改变一切(2022)
  • 三、爆发:提示词成为一门显学(2023)
  • 四、工具进化:提示词不再靠手写(2024)
  • 五、回归本质:和 AI 沟通这件事不会变
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档