首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >一个令人惊艳的新项目,SVD开源了!

一个令人惊艳的新项目,SVD开源了!

作者头像
Jack_Cui
发布2023-11-25 10:01:15
发布2023-11-25 10:01:15
1.2K0
举报
文章被收录于专栏:Jack-CuiJack-Cui

大家好,我是 Jack。

对于 Stable Diffusion,想必我的读者朋友们对此都不陌生。

自 Stability AI 公司发布 SD(全称:Stable Diffusion) 以来,受到了很多人的喜爱。

SDXL 效果

随后技术升级,又发布了 SDXL,名字很有喜感,XL、XXL、XXXL...

SDXL Logo

顾名思义,SDXL 就是 SD 的升级版,图片生成的效果更好、更逼真、分辨率更高!

图片领域做得不错了,Stability AI 再次发力,昨天又发布了 Stable Video Diffusion。

Stability AI 发布

也就是说,通过一句话描述,现在不仅可以生成图片,还可以生成视频了。

举几个例子。

输入:火箭升天

AI 算法直接生成对应的视频:

输入:太空中转动的地球:

AI 算法直接生成对应的视频:

看下更多的例子:

是不是效还不错?Stability AI 把 Stable Video Diffusion 也开源了!

Stable Video Diffusion

一共开源了两个模型:

SVD:能够生成帧率 14、分辨率 576x1024 的视频;

SVD-XT:SVD 的 finetune 升级版,分辨率不变,但能够生成帧率 25 的视频;

前排提醒: 想要本地跑 Stable Video Diffusion,显存得 20G 左右。

1、下载代码库

代码语言:javascript
复制
git clone git@github.com:Stability-AI/generative-models.git
cd generative-models

2、配置 Python 环境

由于第三方依赖库的要求,Python 需要至少是 3.10 版本以上。

推荐使用 conda 新建一个环境。

代码语言:javascript
复制
conda create -n py310 python==3.10

激活环境,并安装相应的依赖。

代码语言:javascript
复制
conda activate py310
python -m pip install -r requirements/pt2.txt

最后再安装 sgm,直接在项目根目录运行即可。

代码语言:javascript
复制
python -m pip install .

如果想要训练模型,还需要安装 sdata,我这里就不说了,毕竟跟我一样训练不起的,应该占绝绝绝绝大多数。

3、模型下载

SVD 模型下载地址:

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid

SVD-XT 模型下载地址:

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt

下载好模型后,将模型放到 checkpoints 目录下。

4、运行算法

可以使用 streamlit 运行:

代码语言:javascript
复制
streamlit run scripts/demo/video_sampling.py --server.port <your_port>

好了,今天就聊这么多吧。

我是 Jack,我们下期见!

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-11-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Stable Video Diffusion
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档