
适合人群:短视频创作者、AI工具爱好者、想搭建自动化内容流水线的朋友
我是做短视频创作的,主攻 AI 写真、早安电台、数字人视频这几个方向,平台在抖音和视频号。
早期的全流程基本是纯手动:想脚本用 AI 对话框复制粘贴、生图去即梦网页一张张点、生成结果不满意再改提示词重新来……一天折腾下来,出不了几条片子,人还特别累。
后来接触到 WorkBuddy,才算把这套流程串了起来——它不只是"聊天 AI",而是能真的帮你干活的桌面智能体。本文记录我用 WorkBuddy + 即梦/可灵 搭建 AI 短视频流水线的完整实战过程,供大家参考。
先说清楚每个工具的定位,避免重复造轮子:
工具 | 角色 | 具体负责 |
|---|---|---|
WorkBuddy | 大脑 + 指挥官 | 生成脚本、写提示词、自动化任务调度 |
即梦 | 生图 + 生视频 | 根据提示词批量出图/短视频片段 |
可灵 | 数字人 + 视频生成 | 生成数字人播报片段 |
剪映 | 后期合成 | 拼接片段、加字幕、配音乐 |
FFmpeg | 自动化合成 | 批量合成画中画、加字幕(代码替代手动剪映) |
核心思路:WorkBuddy 负责"思考和调度",即梦/可灵负责"生产素材",剪映/FFmpeg 负责"组装成片"。
以我最近做的睡眠健康科普数字人视频为例,完整走一遍流程。
我只需要用自然语言告诉 WorkBuddy:
"帮我写一个关于睡眠健康的 60 秒短视频脚本,面向普通观众,语言口语化,每句话配一张关联图片的提示词。"
WorkBuddy 直接输出结构化结果:
【脚本】
1. 你每天睡够8小时,为什么还是累? (时长约5s)
2. 其实睡眠质量比时长更重要。 (时长约5s)
3. 睡前刷手机,蓝光会抑制褪黑素分泌。 (时长约6s)
...
【每句配图提示词】
1. 一个年轻人趴在办公桌上疲惫不堪,暖色调,写实风格
2. 深度睡眠的舒适场景,月光洒进卧室,宁静氛围
3. 睡前躺在床上刷手机的人,屏幕蓝光照射在脸上,冷色调
...传统方式:我得自己想脚本 + 自己写提示词,至少半小时。 现在:一句话,2分钟出结果。
把 Step 1 得到的提示词,直接丢进即梦批量生图。
关键经验:
脚本有了,用可灵的数字人播报功能:

这一步是效率提升的关键。
传统方式:把素材导入剪映,手动拖时间轴、手动加字幕……
我用 WorkBuddy 帮我生成 FFmpeg 命令,一次性批量合成:
bash
复制
ffmpeg -i background.mp4 -i person.mp4 \
-filter_complex "[1:v]scale=360:640[person];[0:v][person]overlay=W-w-20:H-h-20" \
-c:a copy output.mp4含义:背景全屏 + 数字人小画面叠在右下角,一键出片。
还可以自动加字幕(用 FFmpeg drawtext 滤镜),完全不需要手动打字幕。
最终效果:
这部分是我用了几个月总结出来的,真正省时间的方法:
不要一句句问,直接说:
"我要生成10张睡眠健康主题的背景图提示词,每张图对应一个知识点,风格统一写实,输出JSON格式"
WorkBuddy 会直接给你结构化输出,复制进即梦就能用。
我有设置一个每日定时任务:
这样每天选题这一步,完全不用操心。
任务 | 交给 AI? | 原因 |
|---|---|---|
脚本初稿 | ✅ | AI 写得快,人工改细节 |
提示词生成 | ✅ | 结构化输出,效率高 |
数字人形象选择 | ❌ | 要自己看效果,AI 不知道你要什么风格 |
最终成片审核 | ❌ | 必须人工过一遍,避免错别字/配音不同步 |
核心原则:AI 负责"初稿"和"重复劳动",人工负责"审美"和"最终把关"。
用 WorkBuddy + 即梦/可灵 这套组合,我的视频制作效率大概提升了 3-5倍(保守估计)。
适合参考这套流程的人:
关于积分:WorkBuddy 用积分计费,社区发帖可以薅积分(教程文章+1000,被精选再+2000),我这篇文章就这么来的 😄
如果觉得有用,欢迎点赞收藏,有问题可以在评论区交流~
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。