用 WorkBuddy + 即梦/可灵做 AI 短视频：我从0到1的全流程实录

原创

80后老登

发布于 2026-05-06 23:23:47

2351

适合人群：短视频创作者、AI工具爱好者、想搭建自动化内容流水线的朋友

一、写在前面

我是做短视频创作的，主攻 AI 写真、早安电台、数字人视频这几个方向，平台在抖音和视频号。

早期的全流程基本是纯手动：想脚本用 AI 对话框复制粘贴、生图去即梦网页一张张点、生成结果不满意再改提示词重新来……一天折腾下来，出不了几条片子，人还特别累。

后来接触到 WorkBuddy，才算把这套流程串了起来——它不只是"聊天 AI"，而是能真的帮你干活的桌面智能体。本文记录我用 WorkBuddy + 即梦/可灵搭建 AI 短视频流水线的完整实战过程，供大家参考。

二、我的工具组合：各自负责什么？

先说清楚每个工具的定位，避免重复造轮子：

工具	角色	具体负责
WorkBuddy	大脑 + 指挥官	生成脚本、写提示词、自动化任务调度
即梦	生图 + 生视频	根据提示词批量出图/短视频片段
可灵	数字人 + 视频生成	生成数字人播报片段
剪映	后期合成	拼接片段、加字幕、配音乐
FFmpeg	自动化合成	批量合成画中画、加字幕（代码替代手动剪映）

核心思路：WorkBuddy 负责"思考和调度"，即梦/可灵负责"生产素材"，剪映/FFmpeg 负责"组装成片"。

三、实操案例：medical_sleep 数字人视频全流程

以我最近做的睡眠健康科普数字人视频为例，完整走一遍流程。

Step 1：用 WorkBuddy 生成视频脚本 + 分镜提示词

我只需要用自然语言告诉 WorkBuddy：

"帮我写一个关于睡眠健康的 60 秒短视频脚本，面向普通观众，语言口语化，每句话配一张关联图片的提示词。"

WorkBuddy 直接输出结构化结果：

【脚本】
1. 你每天睡够8小时，为什么还是累？  （时长约5s）
2. 其实睡眠质量比时长更重要。         （时长约5s）
3. 睡前刷手机，蓝光会抑制褪黑素分泌。  （时长约6s）
...

【每句配图提示词】
1. 一个年轻人趴在办公桌上疲惫不堪，暖色调，写实风格
2. 深度睡眠的舒适场景，月光洒进卧室，宁静氛围
3. 睡前躺在床上刷手机的人，屏幕蓝光照射在脸上，冷色调
...

传统方式：我得自己想脚本 + 自己写提示词，至少半小时。现在：一句话，2分钟出结果。

Step 2：即梦批量生图（每句话一张背景图）

把 Step 1 得到的提示词，直接丢进即梦批量生图。

关键经验：

即梦一次可以生成4张变体，选最合适的一张
提示词要加"竖屏9:16"或"横屏16:9"后缀，避免尺寸不对
风格保持统一（我固定用"写实风格，柔和光线"），成片看起来更专业

Step 3：可灵生成数字人播报片段

脚本有了，用可灵的数字人播报功能：

上传脚本文本 → 选择数字人形象 → 生成播报视频
输出的是一段数字人正面播报的视频片段

Step 4：FFmpeg 合成（背景 + 数字人画中画 + 字幕）

这一步是效率提升的关键。

传统方式：把素材导入剪映，手动拖时间轴、手动加字幕……

我用 WorkBuddy 帮我生成 FFmpeg 命令，一次性批量合成：

bash

复制

ffmpeg -i background.mp4 -i person.mp4 \
  -filter_complex "[1:v]scale=360:640[person];[0:v][person]overlay=W-w-20:H-h-20" \
  -c:a copy output.mp4

含义：背景全屏 + 数字人小画面叠在右下角，一键出片。

还可以自动加字幕（用 FFmpeg drawtext 滤镜），完全不需要手动打字幕。

Step 5：成片输出

最终效果：

✅ 每句话配不同的睡眠主题背景图（不单调）
✅ 数字人画中画叠加在背景上
✅ 字幕完整（关键词用红色标注）
✅ 全程从脚本到成片，人工干预极少

四、WorkBuddy 提效技巧（干货）

这部分是我用了几个月总结出来的，真正省时间的方法：

技巧1：用自然语言批量生成提示词

不要一句句问，直接说：

"我要生成10张睡眠健康主题的背景图提示词，每张图对应一个知识点，风格统一写实，输出JSON格式"

WorkBuddy 会直接给你结构化输出，复制进即梦就能用。

技巧2：定时任务自动抓取热点话题

我有设置一个每日定时任务：

每天早上自动抓取抖音/小红书健康类热点
筛选出3个适合做视频的话题
自动发到我的QQ邮箱通知我

这样每天选题这一步，完全不用操心。

技巧3：哪些任务适合交给 AI，哪些要人工把关

任务	交给 AI？	原因
脚本初稿	✅	AI 写得快，人工改细节
提示词生成	✅	结构化输出，效率高
数字人形象选择	❌	要自己看效果，AI 不知道你要什么风格
最终成片审核	❌	必须人工过一遍，避免错别字/配音不同步

核心原则：AI 负责"初稿"和"重复劳动"，人工负责"审美"和"最终把关"。

五、总结 & 资源

用 WorkBuddy + 即梦/可灵这套组合，我的视频制作效率大概提升了 3-5倍（保守估计）。

适合参考这套流程的人：

每天需要做多条短视频的创作者
想搭建"AI 自动选题 → 自动生成 → 人工审核"流水线的人
对 FFmpeg/自动化感兴趣，想减少重复剪辑劳动的人

关于积分：WorkBuddy 用积分计费，社区发帖可以薅积分（教程文章+1000，被精选再+2000），我这篇文章就这么来的 😄

如果觉得有用，欢迎点赞收藏，有问题可以在评论区交流～

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

WorkBuddy

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

WorkBuddy

登录后参与评论

0 条评论

热度