首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >用 WorkBuddy + 即梦/可灵 做 AI 短视频:我从0到1的全流程实录

用 WorkBuddy + 即梦/可灵 做 AI 短视频:我从0到1的全流程实录

原创
作者头像
80后老登
发布2026-05-06 23:23:47
发布2026-05-06 23:23:47
2351
举报

适合人群:短视频创作者、AI工具爱好者、想搭建自动化内容流水线的朋友


一、写在前面

我是做短视频创作的,主攻 AI 写真、早安电台、数字人视频这几个方向,平台在抖音和视频号。

早期的全流程基本是纯手动:想脚本用 AI 对话框复制粘贴、生图去即梦网页一张张点、生成结果不满意再改提示词重新来……一天折腾下来,出不了几条片子,人还特别累。

后来接触到 WorkBuddy,才算把这套流程串了起来——它不只是"聊天 AI",而是能真的帮你干活的桌面智能体。本文记录我用 WorkBuddy + 即梦/可灵 搭建 AI 短视频流水线的完整实战过程,供大家参考。


二、我的工具组合:各自负责什么?

先说清楚每个工具的定位,避免重复造轮子:

工具

角色

具体负责

WorkBuddy

大脑 + 指挥官

生成脚本、写提示词、自动化任务调度

即梦

生图 + 生视频

根据提示词批量出图/短视频片段

可灵

数字人 + 视频生成

生成数字人播报片段

剪映

后期合成

拼接片段、加字幕、配音乐

FFmpeg

自动化合成

批量合成画中画、加字幕(代码替代手动剪映)

核心思路:WorkBuddy 负责"思考和调度",即梦/可灵负责"生产素材",剪映/FFmpeg 负责"组装成片"。


三、实操案例:medical_sleep 数字人视频全流程

以我最近做的睡眠健康科普数字人视频为例,完整走一遍流程。

Step 1:用 WorkBuddy 生成视频脚本 + 分镜提示词

我只需要用自然语言告诉 WorkBuddy:

"帮我写一个关于睡眠健康的 60 秒短视频脚本,面向普通观众,语言口语化,每句话配一张关联图片的提示词。"

WorkBuddy 直接输出结构化结果:

代码语言:javascript
复制
【脚本】
1. 你每天睡够8小时,为什么还是累?  (时长约5s)
2. 其实睡眠质量比时长更重要。         (时长约5s)
3. 睡前刷手机,蓝光会抑制褪黑素分泌。  (时长约6s)
...

【每句配图提示词】
1. 一个年轻人趴在办公桌上疲惫不堪,暖色调,写实风格
2. 深度睡眠的舒适场景,月光洒进卧室,宁静氛围
3. 睡前躺在床上刷手机的人,屏幕蓝光照射在脸上,冷色调
...

传统方式:我得自己想脚本 + 自己写提示词,至少半小时。 现在:一句话,2分钟出结果。


Step 2:即梦批量生图(每句话一张背景图)

把 Step 1 得到的提示词,直接丢进即梦批量生图。

关键经验

  • 即梦一次可以生成4张变体,选最合适的一张
  • 提示词要加"竖屏9:16"或"横屏16:9"后缀,避免尺寸不对
  • 风格保持统一(我固定用"写实风格,柔和光线"),成片看起来更专业

Step 3:可灵生成数字人播报片段

脚本有了,用可灵的数字人播报功能:

  • 上传脚本文本 → 选择数字人形象 → 生成播报视频
  • 输出的是一段数字人正面播报的视频片段

Step 4:FFmpeg 合成(背景 + 数字人画中画 + 字幕)

这一步是效率提升的关键。

传统方式:把素材导入剪映,手动拖时间轴、手动加字幕……

我用 WorkBuddy 帮我生成 FFmpeg 命令,一次性批量合成:

bash

复制

代码语言:javascript
复制
ffmpeg -i background.mp4 -i person.mp4 \
  -filter_complex "[1:v]scale=360:640[person];[0:v][person]overlay=W-w-20:H-h-20" \
  -c:a copy output.mp4

含义:背景全屏 + 数字人小画面叠在右下角,一键出片。

还可以自动加字幕(用 FFmpeg drawtext 滤镜),完全不需要手动打字幕。


Step 5:成片输出

最终效果:

  • ✅ 每句话配不同的睡眠主题背景图(不单调)
  • ✅ 数字人画中画叠加在背景上
  • ✅ 字幕完整(关键词用红色标注)
  • ✅ 全程从脚本到成片,人工干预极少

四、WorkBuddy 提效技巧(干货)

这部分是我用了几个月总结出来的,真正省时间的方法:

技巧1:用自然语言批量生成提示词

不要一句句问,直接说:

"我要生成10张睡眠健康主题的背景图提示词,每张图对应一个知识点,风格统一写实,输出JSON格式"

WorkBuddy 会直接给你结构化输出,复制进即梦就能用。


技巧2:定时任务自动抓取热点话题

我有设置一个每日定时任务:

  • 每天早上自动抓取抖音/小红书健康类热点
  • 筛选出3个适合做视频的话题
  • 自动发到我的QQ邮箱通知我

这样每天选题这一步,完全不用操心。


技巧3:哪些任务适合交给 AI,哪些要人工把关

任务

交给 AI?

原因

脚本初稿

AI 写得快,人工改细节

提示词生成

结构化输出,效率高

数字人形象选择

要自己看效果,AI 不知道你要什么风格

最终成片审核

必须人工过一遍,避免错别字/配音不同步

核心原则:AI 负责"初稿"和"重复劳动",人工负责"审美"和"最终把关"。


五、总结 & 资源

用 WorkBuddy + 即梦/可灵 这套组合,我的视频制作效率大概提升了 3-5倍(保守估计)。

适合参考这套流程的人:

  • 每天需要做多条短视频的创作者
  • 想搭建"AI 自动选题 → 自动生成 → 人工审核"流水线的人
  • 对 FFmpeg/自动化感兴趣,想减少重复剪辑劳动的人

关于积分:WorkBuddy 用积分计费,社区发帖可以薅积分(教程文章+1000,被精选再+2000),我这篇文章就这么来的 😄


如果觉得有用,欢迎点赞收藏,有问题可以在评论区交流~

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、写在前面
  • 二、我的工具组合:各自负责什么?
  • 三、实操案例:medical_sleep 数字人视频全流程
    • Step 1:用 WorkBuddy 生成视频脚本 + 分镜提示词
    • Step 2:即梦批量生图(每句话一张背景图)
    • Step 3:可灵生成数字人播报片段
    • Step 4:FFmpeg 合成(背景 + 数字人画中画 + 字幕)
    • Step 5:成片输出
  • 四、WorkBuddy 提效技巧(干货)
    • 技巧1:用自然语言批量生成提示词
    • 技巧2:定时任务自动抓取热点话题
    • 技巧3:哪些任务适合交给 AI,哪些要人工把关
  • 五、总结 & 资源
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档