最近这段时间折腾 n8n,终于把图文类的一键生成跑通了。虽然还有不少优化空间,但起码能跑起来,先用着再说。
搞定图文后,我又马不停蹄地开始研究一键生成视频。毕竟现在的趋势,视频流量才是大头,必须得尽快跟上。
为了搞定视频自动化,我调研了网上各种方案,比如剪映小助手,还有一些开源的剪映 API 项目。
这些方案虽然路子不同,但底层逻辑都是基于剪映:创建草稿、添加素材、编排工作流、拼接视频。最后往往还得导入剪映才能导出,或者依赖收费的云渲染。
说实话,我本来也打算按这个路子走。但转念一想——都 AI 时代了,如果不能让 AI 直接帮我干完,还得人工介入或者依赖笨重的客户端,那算什么好方案?
我就在琢磨:难道没有一种纯代码的方式,能直接生成视频吗?如果有,配合 AI 的编程能力,岂不是能轻松拿捏?
结果顺着这个思路去搜,嘿!还真被我淘到了一个神器——Remotion。
Remotion 是一款基于 React 的视频编辑和渲染库。它将 React 组件与视频时间轴完美结合,允许开发者直接使用 JavaScript 和 React 来创建视频。
与传统的视频编辑软件不同,Remotion 通过编写代码来控制视频的每一个元素。从动画效果到转场特效,从动态文本到复杂场景,一切皆可通过代码实现。
看到这个项目时,我一拍大腿:这不就是我想要的吗?
去官网看了一下它能制作的效果,大家感受一下:
比如这样:

再比如这样:

还有这样的:

出乎我的意料,它可以做很多形式的视频 (更多效果大家可以去官网查看: https://www.remotion.dev/templates
怀着激动的心情,我开始了我的 Vibe Coding。
既然这个项目可以用代码实现视频编辑,那我的思路就很明确了:全程不写一行代码,完全交给 AI。
从一个空白文件夹开始,我让 AI 基于 Remotion 帮我打造一款 MCP 服务。这里面封装了基于 Remotion 实现的各种模板工具,从字幕、转场到各种特效,全部工具化。
然后,我设计了一套提示词,在 n8n 中调用这个 MCP 进行内容生成。
结果,还真被我搞成了。
当然,过程还是挺曲折的。毕竟花了我整整一周的时间,连公众号都没来得及更新。
这期间踩了不少坑,也解决了不少问题:
总之,从设想到实现,中间遇到的问题数不胜数。不过现在 AI 确实强大,遇到问题我就丢给 AI 去改,兵来将挡,水来土掩。
到今天,终于可以自豪地说:1.0 版本勉强实现了!
大家看看最终效果:
(ps: 不要吐槽图片哈,因为这一周都在疯狂测试生成、调试,实在不敢用太贵的图片生成模型,暂时接入了 Coze 的便宜通用模型。不然钱包顶不住。)
不过,我是采用工作流方式设计的。这意味着,到时候我把工作流里的节点一换,不用动这个MCP,就可以无缝切换到即梦等高质量模型,图片效果立马就能上来。哈哈!
我对这个效果还是很满意的,因为我看别人的工作流一堆一堆的节点,最终还不如我这个效果呢。
况且我现在还没加上,牛逼的AI生成视频的,如果接入这个,所有画面应该就都高度相关了,就是不知道到时候钱包顶部顶得住。
如果你也想搞一个一键生成视频的功能,Remotion 强推。
这是它的Github 地址: https://github.com/remotion-dev/remotion
最近 Skills 不是很火吗?我觉得弄个基于 Remotion 的 Skills,体验绝对丝滑。
本文提到的 基于 Remotion 的视频生成 MCP 以及配套的 n8n 完整工作流,目前还在紧锣密鼓地完善中。