做 AI 漫剧、AI 真人剧、解说漫、沙雕梗漫的人,通常都会遇到一个非常高频的问题:
为什么同样一句提示词,生成出来的画面总觉得“不对劲”?
很多时候,问题不在模型,也不完全在风格词,而在一个更基础、却更关键的地方:
你到底想让观众先看什么。
是先看环境? 先看人物? 先看情绪? 还是先看线索?
这个问题一旦没想清楚,后面的镜头就很容易乱: 该拍环境的时候拍成了大脸特写,该看情绪的时候却还停留在全景,该强调线索的时候又没有给特写,最后整段画面看起来“有质感”,但就是不讲故事。
这就是为什么,到了今天,AIGC 剧情创作已经越来越离不开一个基础能力:
景别控制。
景别不是摄影专业学生才需要研究的概念,它本质上是 AIGC 分镜叙事里的底层工具。 你做一条 10 秒到 15 秒的视频,镜头不多,信息密度却很高,越是在这种情况下,景别越重要。因为它直接决定:
很多创作者一开始会背“九大景别”,但真正做项目时又会发现: 为什么有时九大景别不够用?为什么人物、场景、道具的景别判断方式又不一样?为什么同样叫“特写”,拍脸和拍戒指,逻辑完全不同?
这篇文章,我就把这些问题系统讲清楚。
我会从三个层面展开:
第一,九大景别到底是什么,它是不是绝对标准。 第二,人物、场景、道具在景别上的判断逻辑分别是什么。 第三,怎么把这些东西真正落到 AIGC 分镜和提示词里。
文章最后,我还会用几个典型案例,把景别选择拆到可以直接上手的程度。
如果你正在做 AI 真人剧、AI 漫剧等,这篇建议你认真看完。
先说最简洁的定义。
景别,就是镜头取景的远近尺度。
说白一点,就是:
镜头拍得有多远、取了多大范围、让主体在画面里占多大比例。
在传统影视里,景别主要服务于拍摄和叙事。 到了 AIGC 时代,它的作用没有变,甚至更重要了。
因为真人拍摄中,导演、摄影、演员、美术可以现场共同调整; 而在 AIGC 创作里,你要靠提示词一次性把很多信息说清楚。模型没有现场理解能力,它只能根据你给出的信息去推断画面重点。
这就意味着:
景别不是可有可无的修饰词,而是“镜头到底在讲什么”的结构词。
举个最简单的例子。
你写:
女主站在办公室里,眼眶发红。
这句话本身没有错,但问题是—— 你到底希望画面呈现什么?
如果是 大远景,观众看到的是办公室空间,人物只是环境中的一个点,“眼眶发红”几乎没有意义。

如果是 中景,观众能知道她站在桌前、和谁对峙。

如果是 近景,观众才真正能感受到她在强忍情绪。

如果是 特写,你甚至可以只讲她眼角的变化。

同一句话,不同景别,叙事重点完全不同。
所以景别不是“拍得远一点还是近一点”的简单技术问题,它本质上是:
你想让观众先接收到什么信息。
很多人入门时接触到的是“九大景别”:
这套说法当然没问题,而且非常适合教学、记忆和团队沟通。 但必须说清楚一件事:
九大景别是常用分类,不是唯一标准。
更准确地说,景别本来就是一个连续变化的尺度系统。 从极远到极近,它像一条滑动的刻度尺,而不是只有九个固定格子。
所以在实际创作里,景别完全可以继续细分,比如:
这也是为什么你会发现,不同导演、不同摄影师、不同教材,对景别的切分方式并不完全一致。
那么为什么“九大景别”依然值得学?
因为它有一个非常大的优点:
够用。
对于大多数 AIGC 创作者来说,只要能把这九档理解透,已经足够支撑分镜设计、提示词编写和视频生成。
所以更重要的,不是死记“到底是不是九种”,而是理解:
景别是连续的,但创作时需要常用刻度。
九大景别,就是最常用的一套刻度。
这是很多人最容易忽略、但又特别关键的一点。
我们平时一说景别,第一反应往往是人物镜头。 比如:





这套理解没有问题,但它只覆盖了 人物景别。
实际上,在 AIGC 分镜里,景别至少要分成三种常见对象去理解:
重点看:
人物景别最适合讲:
重点看:
场景景别最适合讲:
比如“雪夜皇城全貌”是典型场景镜头,

它和“女主眼角一滴泪”完全不是一个逻辑。
重点看:
道具景别最适合讲:
比如“离婚协议书”“旧照片日期”“戒指刻字”“手机来电界面”,这些都更适合用道具景别来理解。

所以以后你写提示词时,可以先问自己一句:
这一镜的主角到底是“人”“空间”还是“物”?
这个问题一旦判断对了,景别选择会清楚很多。
下面正式进入核心部分。 我会按照 “定义—适用场景—AIGC 用法—案例” 来讲。
人物在画面里非常小,环境占绝对主体。
交代世界、地点、场面和气势。
大远景不要拿来讲细腻情绪。 它更适合交代“故事发生在哪里”,而不是“人物此刻心里多难过”。
AI真人剧: 夜晚的集团大楼外景,主角站在楼前台阶下,人物很小,城市霓虹占满画面。

古风题材: 雪夜皇城全貌,宫灯连绵,长廊与殿宇层层展开,一名白衣女子立于宫门前。

人物完整可见,但环境仍占很大比重。
交代人物与空间的关系,同时可以看到大致动作。
远景特别适合“人物登场”。 尤其是霸总、律师、主角进场这类镜头,远景非常好用。

一个穿深色西装的男人从集团大厅入口稳步走入,人物完整可见,环境宽阔高级,镜头缓慢跟随。

人物从头到脚完整入镜,人物已经成为画面主体。
交代服装、站位、姿态和全身动作。
全景是“立人物”的好镜头。 特别适合定妆、关系初立、人物第一次正式出现在一场戏中。
雪夜长廊中,白衣神女站在前方,黑袍男子站在后方不远处,两人全身入镜,衣摆和发丝完整可见。

通常拍到膝盖或大腿附近。
兼顾人物动作、关系和情绪。
中全景是剧情镜头里非常实用的一档。 它比全景更聚焦人物,比中景又更能保留动作。
办公室内,女主站在桌前把文件放到桌面上,男主坐在对面抬头看她,两人的动作和距离关系清晰。

一般拍到腰部上下。
稳定叙事、推进剧情、承载对话。
中景是剧情镜头里最稳的主力景别。 不会选的时候,用中景通常不会错。
天台上,少年缓缓转身看向身后的女孩,风吹动校服衣角,两人保持距离,画面安静而紧张。

一般拍到胸口附近。
开始强调表情和上半身动作,情绪集中度明显提高。
中近景特别适合“戏味开始出现”的那一刻。 很多好看的情绪戏,真正开始有张力,往往都是从中近景开始。
女主手里攥着文件,呼吸有些急,眼眶微红却极力克制,镜头轻微推进。

一般拍到肩部以上,脸部已经占据画面主体。
承载情绪落点和明显反应。
近景适合“把一句重台词或一个强情绪真正落下来”。
男主缓缓抬眼,嘴角带一丝冷笑,眼神压迫感很强,肩部以上入镜,面部表情清晰。

突出脸、手或关键物件的局部信息。
强调剧情重点、线索、细节。
特写不是“随便拍近一点”,而是告诉观众:
这里很重要。
特写,文件封面上“离婚协议书”几个字清晰可见,纸张边缘被手指捏得微微发皱。

只拍极小区域,如眼睛、泪水、指尖、刻字。
制造强钩子、强情绪和强信息冲击。
大特写不要滥用。 一旦用了,它通常意味着这一镜是“重锤”。
大特写,签字笔停在纸面上方,指尖微微发抖,墨水还未落下。

很多人学了九大景别,还是不会用。 原因不是记不住,而是不知道什么时候该用哪一个。
最简单、也最实用的方法就是:
先看这一镜的剧情功能。
下面是一个可以直接套的实操表。
剧情功能 | 推荐景别 | 为什么 |
|---|---|---|
开场交代地点 | 大远景 / 远景 | 先让观众知道故事发生在哪 |
主角第一次出场 | 远景 / 全景 | 先立住角色和气场 |
交代服装和站位 | 全景 / 中全景 | 方便看全身与人物关系 |
正常对话推进 | 中景 | 稳定、清楚、节奏好控制 |
情绪开始变化 | 中近景 | 情绪更集中,张力开始上来 |
情绪爆点 | 近景 | 观众能直接接收到表情变化 |
强调关键物件 | 特写 | 告诉观众“这个东西很重要” |
强调极细节 | 大特写 | 最适合做钩子和反转点 |
这张表你可以直接背下来。 以后做 AIGC 分镜时,先想这一镜的功能,再定景别,效率会高很多。
下面我用三个常见题材来做案例拆解。
场景:总裁办公室
时间:傍晚
人物:张华、李雪远景 → 中景 → 中近景 → 近景 → 特写
以下分镜图皆使用即梦5.0Lite模型生成,虽然人物有些崩,但已是即梦图形Seedream各版本模型中最好的了
镜1:远景 交代总裁办公室全貌。 女主站在桌前,男主坐在桌后,空间、距离和权力关系先立住。

镜2:中景 女主把文件放到桌面上,开始对话。 这一镜以动作和关系推进为主。

镜3:中近景 女主攥紧手指,呼吸变快,眼眶微红。 情绪开始出现。

镜4:近景 男主缓缓抬眼,表情冷淡甚至带一点冷笑。 情绪真正落下来。

镜5:特写 桌上文件封面写着“离婚协议书”。 这时信息点被明确强调。

因为这场戏的叙事逻辑是:
空间 → 关系 → 情绪 → 重点信息
如果一上来就特写文件,戏味不够; 如果一直停在中景,信息有了,但不抓人。 只有景别层层推进,戏才会成立。
大远景 → 全景 → 中景 → 中近景 → 大特写
镜1:大远景 雪夜长廊、宫灯、飞雪、深宫环境。 先建立古风世界。

镜2:全景 白衣女子在前,黑袍男子在后,两人全身入镜,衣摆和距离关系清晰。

镜3:中景 女子回头,男子停步。 开始进入人物之间的“戏”。

镜4:中近景 女子抬眼,男子沉默。 这一镜主要讲眼神拉扯。

镜5:大特写 女子眼角微红,睫毛上停着一点泪光。 作为情绪钩子收尾。

为什么这样拆
古风重逢戏最怕的问题,是一味追求氛围,结果没有叙事。 所以必须用景别把它拆开:
先是环境之美,再是人物之距,最后才是情绪之细。
全景 → 中景 → 特写 → 近景 → 大特写
镜1:全景 出租屋客厅全貌。 桌上有旧手机、拆开的信、冷掉的咖啡。

镜2:中景 男主独自坐在桌前,低头看信。 这一镜讲人物状态。

镜3:特写 信封上的名字。 线索第一次被明确指出。

镜4:近景 男主抬头,神情从疑惑转为紧张。 人物反应到位。

镜5:大特写 旧照片角落的日期。 作为旁白的钩子。

因为解说漫本质上不是靠角色对白推进,而是靠:
旁白 + 状态镜头 + 线索镜头
所以解说漫里的特写和道具特写,往往比动态漫更重要。
景别不是通用平均分配的。 不同内容,重点不同。
优先用: 中景 / 中近景 / 近景 / 特写
因为它最吃表演和情绪。
优先用: 全景 / 中全景 / 中景 / 特写
因为既要看人物,又要看服装、动作和构图。
优先用: 中景 / 近景 / 道具特写 / 大特写
因为它靠旁白带叙事,画面要讲状态和线索。
优先用: 中景 / 近景 / 面部特写 / 大特写
因为它的笑点主要来自夸张表情、离谱反应和魔性收尾。
这一部分很重要。 因为很多画面“不对劲”,并不是因为模型差,而是景别用错了。
问题:环境没立住,人物关系也没立住。 修正:先给远景、全景或中景,后面再切近。
问题:信息清楚,但画面平。 修正:关键情绪点切近景,关键线索切特写。
比如只写:
特写,情绪强
这是不够的。 你要写清楚:
模型才知道重点在哪里。
问题:观众根本看不到脸。 修正:拆镜头。 先用大远景交代环境,再切近景讲情绪。
问题:模型容易乱,节奏也会碎。 修正:一条 10–15 秒的视频,通常控制在 2到4个景别 更稳。
以后你写每一镜时,先问自己四个问题:
这四个问题一旦回答清楚,景别就很容易选对。
很多人做 AIGC 内容时,会把主要精力放在风格词上:
电影感、质感、氛围感、高级感、通透感……
这些当然有用,但如果景别没选对,风格再高级,也只是“好看但不讲故事”。
真正决定一段画面是否成立的,往往是更底层的结构问题:
而景别,正是这些问题最直接的答案。
所以学景别,不是为了背九个名词; 而是为了在 AIGC 分镜里建立一种更专业的镜头意识:
知道什么时候该远,什么时候该近,什么时候该看人,什么时候该看物,什么时候该给观众留呼吸,什么时候该把情绪一锤打下去。
这才是景别真正的价值