首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏开源心路

    AI生成视频-Pika

    背景介绍 Pika 是一个使用 AI 生成和编辑视频的平台。它致力于通过 AI 技术使视频制作变得简单和无障碍。 Pika 1.0 是 Pika 的一个重大产品升级,包含了一个新的 AI 模型,可以在各种风格下生成和编辑视频,如 3D 动画,动漫,卡通和电影风格。 大拇指向下 告诉机器人(和 Pika 实验室团队)Pika 做了一些丑陋、错误的东西,或者视频完全没有移动。 重新生成 - 重复提示 使用相同的提示词和参数再生成一个视频。 现在我们需要告诉 AI 实际上我们想要生成什么样的片段。 我们很高兴推出 Pika 1.0,这是一次重大的产品升级,包括一个新的 AI 模型,它能够以 3D 动画、动漫、卡通和电影等各种样式生成和编辑视频,以及一个新的 Web 体验,使其更容易使用。

    2K10编辑于 2023-12-06
  • 来自专栏全栈技术

    AI视频制作一本通:文本生成视频、图片生成视频视频生成视频

    第一部分:文本生成视频1. 文本生成视频概述随着人工智能(AI)技术的飞速发展,视频制作领域也迎来了创新的浪潮。文本生成视频是其中的一项令人激动的进展,它利用自然语言处理技术将文本内容转化为视频。 步骤3:音频合成为了增强视频的吸引力,您可以合成配音或背景音乐。音频合成可以使用文本转语音(TTS)技术来实现,将文本转化为声音。步骤4视频合成最后,将生成的图像和音频合成为视频。 您需要将每个图像添加到视频的连续帧中,并选择合适的编解码器。步骤4:添加音频(可选)如果需要,您可以为视频添加音频轨道。这可以是背景音乐、解说词或其他声音。3. 您提供一些输入或引导,生成模型将生成相应的视频。步骤4:后期处理(可选)生成视频可能需要进行后期处理,如添加特效、音频合成等。3. # 100维的噪声向量generated_video_frames = generator.predict(input_data)# 步骤4:后期处理(可选)# 在生成视频上添加特效、音频等# 保存生成视频

    3.4K62编辑于 2023-11-07
  • 来自专栏算法一只狗

    AI解决生成视频“闪烁”问题

    在上一期中,我曾经介绍了用ControlNet结合Mov2Mov插件生成新的视频。虽然它能够快速的对视频中的人物进行转换,但是还存在难以解决的闪烁问题。 造成闪烁的原因很简单,是因为AI是一帧一帧生成图片然后再合成的,所有每张图片本质上不太连贯,最后就会造成视频闪烁的出现。但是这个难题近期被南洋理工大学的团队很好的解决。 首先来看看他们生成视频效果:可以看到,生成视频很丝滑,而且人物的动作衔接的很连贯。 利用上面的方法进行生成后,在连续的十几秒中,每一幅图片的细节都生成相似,就能够有效缓解视频闪烁的情况出现。 下图是作者对比Stable-Diffusion的结果:当然,在不同的模型比较上,该作者提出的方法在生成视频的稳定性上效果明显提高:同时,在输入文本中仅需更改几个词语,在视频背景保持不变的情况下,可以不断的调节视频中的细节

    87920编辑于 2024-10-10
  • 来自专栏音视频技术

    AI自动剪辑生成视频探索实践

    文/赵剑 整理/LiveVideoStack 大家好,我是赵剑,来自网易云音乐,本次分享的主题是AI自动剪辑生成视频的探索实践,内容主要分为以下几个部分:  What — 什么是AI自动生成音乐视频? Why — 为什么需要基于AI自动生成音乐视频?  How — 如何实现AI自动生成音乐视频? 首先为大家播放由三段不同类型的音乐视频,全程无人工参与,完全通过AI自动生成。 1、Why音乐视频自动化剪辑生成 接下来正式为大家介绍AI自动剪辑生成视频的探索实践。 首先,为什么做音乐视频自动生成? 2、AI自动剪辑生成音乐视频系统 其次,如何搭建高效自动生成音乐视频的系统? 4、总结与展望 既然已经搭建完成了音乐视频自动生成系统,那么后期就要考虑如何评价生成视频的质量及对于歌曲本身消费的转化率,于是需要搭建音乐视频评价系统。

    3.4K21编辑于 2023-04-04
  • 来自专栏翩翩白衣少年

    MuseV:不限视频时长的AI视频生成工具

    在不久前 OpenAI Sora 以其优秀且惊人的视频生成效果迅速走红,更是在一众文生视频模型中脱颖而出,成为了文生视频领域的领头羊。 同时它也推动了行业内文生视频技术的发展。 今天小编为大家分享一款新开源的文生视频项目MuseV,据说可以生成不限时长的AI视频。 项目背景 MuseV 项目在2023年7月就已经实现了,但是受到近期 Sora 进展的启发,才决定开源出来。 项目介绍 MuseV 是一个基于扩散模型的虚拟人视频生成框架。它采用了新颖的视觉条件并行去噪方案,支持无限长度视频生成。 在更大、更高分辨率、更高质量的文本视频数据集上进行训练可能会使 MuseV 更好。 • 有限类型的长视频生成。视觉条件并行去噪可以解决视频生成的累积误差,但当前的方法只适用于相对固定的摄像机场景。 总结 MuseV 以其无限长度视频生成以及对 Stable Diffusion 生态的支持以及多参考图像技术,成为视频生成领域的新兴力量。

    1.9K10编辑于 2024-04-13
  • 来自专栏程序大视界

    2026国产AI视频生成工具推荐

    Sora关停、国产崛起:2026年AI视频生成工具格局大洗牌! OpenAI于2026年3月24日正式关停Sora,AI视频生成市场迎来了历史性的转折点。国产工具如何抓住机遇?创作者该何去何从? 01 — OpenAI挥刀斩Sora 2026年3月24日,OpenAI正式宣布关停Sora独立App、API接口及ChatGPT内置视频功能,全面退出消费级AI视频生成市场。 知识分享、生活记录 单次12秒 海螺AI 创意元素生成、动画风格出色 创意短视频、动画制作 约6秒 Vidu 生成稳定、速度适中 通用场景 约4秒 实测数据对比 根据CSDN博主测评数据,在生成速度方面 、Runway: 4秒 > Pika: 3秒 ✨ 可灵AI:国产之光 作为快手团队的产品,可灵AI在技术上表现亮眼: 高质量输出:支持生成长达2分钟、30fps的高质量视频 多宽高比支持:满足抖音、B站 分段生成视频:单次生成时间有限,可以分段生成再拼接 关注高峰期:国产工具在下午3-6点可能出现排队,错峰使用效率更高 06 — 未来展望 AI视频生成市场正在经历剧烈变革: 技术层面:可控性、一致性

    2.3K20编辑于 2026-04-10
  • 来自专栏AI算法能力提高班

    Sora | 最强AI视频生成大模型

    [AI Milestone] Sora | 2024年最强AI视频生成大模型 本文主要从Sora的诞生背景、技术原理、能力演示、应用前景和变现思路等多个角度进行介绍这一划时代的最新视频生成技术。 然而,早期的AI视频通常存在一些限制,如视频长度有限(通常只有几秒钟),场景逼真度不足,元素突然出现或消失,以及运动不连贯等问题,这些问题使得视频内容容易被识别为AI生成。 OpenAI发布的Sora模型在演示视频中展示了显著的进步,其生成视频内容在质量上几乎无法被察觉为AI制作。Sora能够生成长达一分钟的视频,这在当时的AI视频中是一个重要的突破。 ,展示了AI在创意图像生成方面的能力。 Sora的出现打破了这一局限,它能够根据文本指令生成长达一分钟的视频,这在生成AI领域是一个重大突破,类似于ChatGPT在自然语言处理(NLP)领域的影响。

    2.6K10编辑于 2024-03-13
  • 来自专栏科技云报道

    AI写小说、绘画、剪视频生成AI更火了!

    有观点认为,2022年将是生成AI从技术成熟到深入社会基本面的元年。 生成AI爆发式增长: 从图片到视频 最近几年,AI技术在视觉领域的发展可谓是“神速”。 今年4月份,OpenAI发布的第二代DALL-E 2模型,再次为图像生成领域树立了全新标杆。 虽然本质上来说,视频就是一系列图像的叠加,但相比于生成图像,用文字来生成视频时,不仅需要生成相同场景下的多个帧,还要保证相邻帧之间的连贯性。 由于训练模型时可用的高质量视频数据非常少,但计算量却很大,大大增加了视频生成任务的复杂性。 Phenaki生成视频示例 目前,国内也有不少生成AI的应用。 例如,字节跳动旗下的剪映APP提供AI生成视频功能,并可以免费使用。

    2K20编辑于 2022-12-08
  • 来自专栏猫头虎AI技术分享

    快速上手 AIAI 视频与音频生成教程

    ( model="gpt-4o-mini-tts", voice="alloy", input="欢迎收看AI视频与音频生成教程!") GPT-4o 语音接口 + MoviePy视频叠加,即可生成讲解类AI视频视频时长 5s~60s 七、进阶:AI视频加字幕与动态封面生成字幕:ffmpeg -i final_ai_video.mp4 -vf subtitles=subtitles.srt 语音生成✅ 30+语言mp3 Runway 视频生成 英文最佳 mp4 Pika Labs 视频生成✅ 中文良好 mp4 MoviePy 合成工具✅ 任意 mp4 总结与未来展望 AI视频生成技术正迅速进入创作者工作流,“创意”比“工具”更重要。

    4.7K351编辑于 2025-10-06
  • 来自专栏一个程序猿的异常

    Sora AI:如何生成逼真视频,推动创意界限

    文章速览 OpenAI Sora是一个能够生成高质量、连贯流畅视频AI模型, 它能够根据文本描述生成长达1分钟的视频。 总的来说,OpenAI Sora是一个强大的视频生成模型,它能够生成高品质、连贯流畅的视频,支持多镜头切换和复杂场景的生成,同时具备良好的安全性和可靠性。 OpenAI Sora的扩散模型工作原理主要是通过逐步移除视频中的噪声来生成清晰的视频。Sora的起点是类似于静态噪声的视频画面,通过多个步骤逐步去除噪声,最终生成一个清晰的视频画面。 一次性生成视频:Sora的另一个特点是可以生成整个视频,而不是逐帧生成。这种方式避免了其他方法中的挑战,如确保即使对象暂时从视野中消失,也能保持不变。 最后,Sora的这种能力展示了AI技术在电影行业重塑方面的潜力,它可能会改变整个电影产业的生产方式。

    68010编辑于 2024-02-27
  • 混合AI模型秒生成高清流畅视频

    混合AI模型实现秒级高清视频生成研究人员开发出一种名为CausVid的混合人工智能方法,能够在数秒内创建高质量视频。该方法结合了扩散模型和自回归架构,类似于知识渊博的教师指导聪慧学生的学习过程。 技术原理与传统逐帧生成(自回归)或全序列处理(扩散模型)不同,CausVid采用混合方法:使用预训练的扩散模型作为"教师模型"训练自回归的"学生模型"快速预测下一帧确保视频质量和帧间一致性核心功能该工具能够 :根据简单文本提示生成视频片段将静态照片转换为动态场景扩展现有视频长度在生成过程中通过新输入实时修改内容性能表现在测试中,CausVid展现出卓越性能:生成高分辨率10秒视频的速度比竞争对手快100倍在 30秒长视频测试中质量和一致性领先在900多个文本提示测试中获得84.27的最高综合评分在图像质量和真实人类动作等类别中表现最佳应用前景该技术可用于:视频编辑任务辅助实时直播多语言同步视频生成视频游戏内容渲染机器人训练模拟快速生成技术优势相比传统方法 这项技术有望实现小时级甚至无限时长的高稳定性视频生成

    38010编辑于 2025-08-31
  • 来自专栏程序那些事儿

    Runway Gen2:AI视频生成的未来

    Runway Gen2 是一种由 Runway Research 开发的新的文本到视频生成器。它是第一款公开可用的文本到视频模型,能够“真实和一致”地合成新视频。 突破 Gen2 的突破在于它能够生成逼真和一致的视频。这要归功于其使用了一种新的深度学习模型,该模型能够学习从文本和视频中捕捉信息。该模型由一个巨大的数据集训练,该数据集包括图像、视频和文本。 使用方式 Gen2 提供了多种生成视频的方式,你可以直接通过文本描述来生成一段视频,当然,你也可以根据图片和文字的描述来生成视频,此外,你还可以通过对视频进行神奇描绘来生成视频。 配合着类似 midjourney 等图片生成工具,你完全可以制作自己的动画视频。 应用 Gen2 具有广泛的应用前景。它可用于: 创意表达,创建新的艺术作品、视频游戏、电影等。 例如,Gen2 生成视频可能存在偏见或错误。此外,Gen2 可能被用于生成虚假或误导性的视频。 结论 Runway Gen2 是一项具有重要潜力的技术。

    1.2K10编辑于 2023-11-30
  • 来自专栏AI科技评论

    视频 | AI实时生成材质,效果直逼好莱坞大片

    我们的卷积神经网络可以提供这些图像的实时预测结果,这些预测与真正的渲染图像难以分辨,并且实时生成AI科技评论按:这里是,雷锋字幕组编译的Two minutes paper专栏,每周带大家用碎片时间阅览前沿技术,了解AI领域的最新研究成果。 而且,我们的卷积神经网络可以提供这些图像的实时预测结果,这些预测与真正的渲染图像难以分辨,并且实时生成视频原址:https://www.youtube.com/watch?v=6FzVhIV_t3s 论文原址:https://arxiv.org/pdf/1804.08369.pdf

    1K30发布于 2018-07-27
  • 来自专栏wayn的程序开发

    用笔记本轻松玩转 AI 生成视频

    最近,在 github 看到了一个名为 FramePack 的图生视频项目,基于预测神经网络结构,可以在资源有限的设备上生成高质量的视频。 它通过将上下文压缩成固定长度,使得生成任务的工作量与视频长度无关,从而实现高效且资源友好的视频生成。 什么是 FramePack? 它通过逐步生成下一帧内容,实现高质量视频的连续输出。与传统的视频扩散模型不同,FramePack 并不受视频长度限制,能够在资源有限的设备上处理成千上万帧的视频生成任务。 渐进式生成 + 可视化反馈 模型采用逐帧或逐段生成的方式,用户可以在生成过程中实时查看当前结果,获得视觉反馈。 即使是生成一分钟以上的长视频,也可以边生成边预览,无需等待全部完成。 Preview) 由于 FramePack 是逐帧或逐段生成的模型,视频会随着每一步推理越来越长。

    1.5K21编辑于 2025-05-01
  • 来自专栏希里安

    虚构世界的建筑师:AI视频生成

    --smart-servlet 3、2024年2月15日,openai发布视频生成大模型sora。可以根据文字描述生成逼真的视频,震惊了很多人。 这里推荐以下百度的飞桨PaddlePaddle学习平台进行入门:https://www.paddlepaddle.org.cn/tutorials 视频生成模型原理浅谈 AI视频生成模型的原理基于机器学习 在视频生成的情况下,这意味着模型学习如何从随机噪声生成结构化的视频帧。 文本条件:这种类型的模型受到输入文本的条件约束。 在视频生成中,Transformer可以被用来理解和生成视频帧的序列,因为视频本质上是一系列图像。 高保真视频生成:模型的最终目标是生成高保真度、高分辨率的视频,这些视频在视觉上令人信服,并能够表现出丰富的动态和物理行为。

    47110编辑于 2024-02-22
  • 来自专栏目标检测和深度学习

    产品体验|AI视频生成产品新体验

    用的Colab里面的V100显卡,没有A100了,16G显存刚好够25帧的视频生成生成时间大概144秒。 就是这个对硬件要求实在太高,希望社区大佬给力一些,优化到可以本地跑。 下面是测试生成视频。 ​ 4. **最新信息访问**:尽管其训练数据只到2023年4月,但它可以通过内置的浏览器工具访问和引用最新的网络信息。 5. 演示视频 https://m.okjike.com/originalPosts/655c78daf9a492630b2f88d9 之前说过的 SEINE 视频生成模型,代码已经开源,我自己试 - 即刻 c)油管上的简介和详细介绍视频(需魔法) 演示视频 https://mp.weixin.qq.com/s/HciZfrSQqHl4ZV6ropvexQ 图片变视频只需一“指”!

    54410编辑于 2023-11-27
  • 来自专栏Java项目实战

    AI绘画专栏stablediffusion AI视频 漫画「Infinigen」AI生成100%还原大自然

     前几天我们还在使用图片转3D动态,现如今就出现了3D场景,长电影生成指日可待,让我们跟随官方的视频开始吧~ 论文地址:https://arxiv.org/pdf/2306.09310.pdf Github 应用:Infinigen可以用于多个领域的人像图片生成: 1. AI头像:Infinigen可以根据用户输入的描述信息生成相应的头像,实现自定义AI头像功能。 2. 4.  villagers图片生成:Infinigen可以批量生成不同人物的图片,实现类似某游戏中的villagers人物图功能。 调用Infinigen模型的生成接口,传入第一步的人物信息。 3. Infinigen会基于输入信息生成一张人像图片,并返回图片数据。 4. 前端解析图片数据,并显示生成的人像图片。 它开发的Infinigen可以生成逼真的人像图片。Infinigen和类似的GAN为个性化推荐和生成AI提供了一定技术基础。 2.

    80610编辑于 2023-11-30
  • 来自专栏猫头虎博客专区

    智谱新清影正式发布,生成 10 秒 4K60 帧 AI 视频

    智谱新清影正式发布,生成 10 秒 4K60 帧 AI 视频 大家好,我是猫头虎! 今天给大家带来一条劲爆消息,智谱技术团队的最新大招——新清影,一款支持4K超清视频生成并自带音效的AI视频生成神器正式发布! 超清画质:支持生成10秒、4K、60帧的超高清视频,画质达到了影像新高!高清画面+流畅帧率,让视频体验更上一层楼! 一次生成4视频:多通道输出,效率倍增 支持多通道输出:在一次指令下可以同时生成4视频,大大提高了视频生产效率,对于需要高效视频制作的团队而言,真的是一大福音! 如何使用? 从图像生成视频视频与音效的完美结合,新清影不仅开创了视频生成的新时代,还让AI视频的可能性大大扩展。 这意味着AI不再只是“制作画面”,它开始理解“画面+声音”的综合表达。 如何从行业中受益?

    86810编辑于 2024-11-11
  • 来自专栏码匠的流水账

    langchai4j结合zhipu-ai生成图片

    序本文主要研究一下怎么通过langchai4j结合zhipu-ai生成图片步骤pom.xml<dependency> <groupId>dev.langchain4j</groupId> < artifactId>langchain4j-community-zhipu-ai</artifactId> <version>1.0.0-beta1</version></dependency> prompt=Beautiful house on country side,就可以得到图片链接小结langchain4j集成了Azure OpenAI Dall·E、OpenAI Dall·E、Google Imagen、Cloudflare Workers AI、ZhiPu AI、Xinference这几种图像大模型。 对于ZhiPu AI来讲,提供了ZhipuAiImageModel,通过generate方法即可生成图片。docimage-modelsZhiPu AI

    39000编辑于 2025-02-25
  • 来自专栏Prompt Engineering

    B站视频文案生成指令:让AI帮你写脚本

    这个指令做什么简单说,这是一套给AI用的"工作指南"。你把视频的基本信息告诉AI,它按照B站内容的规律,帮你生成完整的视频脚本框架。 核心逻辑就三步:你提供视频主题、类型、时长等基础信息AI按照B站内容规律生成结构化脚本你根据实际情况调整优化适用场景这个指令适合:知识科普、产品测评、游戏解说、教程类视频创作者需要批量产出内容的团队想提升视频完播率和互动率的 关于调整:AI生成的内容是框架,不是成品。 你需要:把AI生成的"标准话术"改成你自己的说话方式根据实际拍摄素材调整内容顺序删掉那些听起来很AI、不像人说的话加入你的个人观点和真实体验关于数据:指令里的SEO和数据优化建议,可以参考,但B站的推荐算法一直在变 几个坑不要照搬:AI生成的文案往往"正确但无聊",缺少个人特色,照搬会让视频失去灵魂注意时效:AI的知识有时间限制,它提到的热梗可能已经过时,需要你自己判断风格问题:如果你的频道已经有明确的个人风格,这个指令可能会让文案显得

    1.2K10编辑于 2025-10-19
领券