首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏开源心路

    AI生成视频-Pika

    背景介绍 Pika 是一个使用 AI 生成和编辑视频的平台。它致力于通过 AI 技术使视频制作变得简单和无障碍。 Pika 1.0 是 Pika 的一个重大产品升级,包含了一个新的 AI 模型,可以在各种风格下生成和编辑视频,如 3D 动画,动漫,卡通和电影风格。 大拇指向下 告诉机器人(和 Pika 实验室团队)Pika 做了一些丑陋、错误的东西,或者视频完全没有移动。 重新生成 - 重复提示 使用相同的提示词和参数再生成一个视频。 现在我们需要告诉 AI 实际上我们想要生成什么样的片段。 我们很高兴推出 Pika 1.0,这是一次重大的产品升级,包括一个新的 AI 模型,它能够以 3D 动画、动漫、卡通和电影等各种样式生成和编辑视频,以及一个新的 Web 体验,使其更容易使用。

    1.9K10编辑于 2023-12-06
  • 来自专栏全栈技术

    AI视频制作一本通:文本生成视频、图片生成视频视频生成视频

    第一部分:文本生成视频1. 文本生成视频概述随着人工智能(AI)技术的飞速发展,视频制作领域也迎来了创新的浪潮。文本生成视频是其中的一项令人激动的进展,它利用自然语言处理技术将文本内容转化为视频。 文本生成视频的应用非常广泛,可以根据不同场景和目的进行定制。第二部分:图片生成视频1. 图片生成视频原理图片生成视频是将一系列静态图片转化为视频的过程。在这一部分,我们将探讨图片生成视频的基本原理。 第三部分:视频生成视频1. 视频生成视频原理视频生成视频是一种使用人工智能技术合成新视频的方法。它借助生成对抗网络(GANs)和深度学习模型,可以用于各种应用,包括电影特效、艺术实验和视频内容生成。 步骤2:训练生成模型使用生成对抗网络或其他深度学习模型,对视频数据进行训练。模型将学会从输入数据生成逼真的视频。步骤3:生成视频一旦训练完成,您可以使用生成模型来合成新的视频内容。 您可以根据需要使用不同的生成模型和后期处理技术。这就完成了本指南的三部分:文本生成视频、图片生成视频视频生成视频

    3.2K62编辑于 2023-11-07
  • 来自专栏算法一只狗

    AI解决生成视频“闪烁”问题

    在上一期中,我曾经介绍了用ControlNet结合Mov2Mov插件生成新的视频。虽然它能够快速的对视频中的人物进行转换,但是还存在难以解决的闪烁问题。 造成闪烁的原因很简单,是因为AI是一帧一帧生成图片然后再合成的,所有每张图片本质上不太连贯,最后就会造成视频闪烁的出现。但是这个难题近期被南洋理工大学的团队很好的解决。 首先来看看他们生成视频效果:可以看到,生成视频很丝滑,而且人物的动作衔接的很连贯。 利用上面的方法进行生成后,在连续的十几秒中,每一幅图片的细节都生成相似,就能够有效缓解视频闪烁的情况出现。 下图是作者对比Stable-Diffusion的结果:当然,在不同的模型比较上,该作者提出的方法在生成视频的稳定性上效果明显提高:同时,在输入文本中仅需更改几个词语,在视频背景保持不变的情况下,可以不断的调节视频中的细节

    80120编辑于 2024-10-10
  • 来自专栏音视频技术

    AI自动剪辑生成视频探索实践

    文/赵剑 整理/LiveVideoStack 大家好,我是赵剑,来自网易云音乐,本次分享的主题是AI自动剪辑生成视频的探索实践,内容主要分为以下几个部分:  What — 什么是AI自动生成音乐视频? Why — 为什么需要基于AI自动生成音乐视频?  How — 如何实现AI自动生成音乐视频? 首先为大家播放由三段不同类型的音乐视频,全程无人工参与,完全通过AI自动生成。 以上三个视频都由我们的音视频实验室“AI一键自动生成”音乐视频系统生成,它整合了音乐、视频、文本等相关的原子算法,从音乐内容及视频内容两部分进行分析,多模态、多角度地全自动生成音乐视频,助力音乐视频的创作 1、Why音乐视频自动化剪辑生成 接下来正式为大家介绍AI自动剪辑生成视频的探索实践。 首先,为什么做音乐视频自动生成? 2、AI自动剪辑生成音乐视频系统 其次,如何搭建高效自动生成音乐视频的系统?

    3.3K21编辑于 2023-04-04
  • 来自专栏翩翩白衣少年

    MuseV:不限视频时长的AI视频生成工具

    在不久前 OpenAI Sora 以其优秀且惊人的视频生成效果迅速走红,更是在一众文生视频模型中脱颖而出,成为了文生视频领域的领头羊。 同时它也推动了行业内文生视频技术的发展。 今天小编为大家分享一款新开源的文生视频项目MuseV,据说可以生成不限时长的AI视频。 项目背景 MuseV 项目在2023年7月就已经实现了,但是受到近期 Sora 进展的启发,才决定开源出来。 项目介绍 MuseV 是一个基于扩散模型的虚拟人视频生成框架。它采用了新颖的视觉条件并行去噪方案,支持无限长度视频生成。 在更大、更高分辨率、更高质量的文本视频数据集上进行训练可能会使 MuseV 更好。 • 有限类型的长视频生成。视觉条件并行去噪可以解决视频生成的累积误差,但当前的方法只适用于相对固定的摄像机场景。 总结 MuseV 以其无限长度视频生成以及对 Stable Diffusion 生态的支持以及多参考图像技术,成为视频生成领域的新兴力量。

    1.8K10编辑于 2024-04-13
  • 来自专栏AI算法能力提高班

    Sora | 最强AI视频生成大模型

    [AI Milestone] Sora | 2024年最强AI视频生成大模型 本文主要从Sora的诞生背景、技术原理、能力演示、应用前景和变现思路等多个角度进行介绍这一划时代的最新视频生成技术。 然而,早期的AI视频通常存在一些限制,如视频长度有限(通常只有几秒钟),场景逼真度不足,元素突然出现或消失,以及运动不连贯等问题,这些问题使得视频内容容易被识别为AI生成。 OpenAI发布的Sora模型在演示视频中展示了显著的进步,其生成视频内容在质量上几乎无法被察觉为AI制作。Sora能够生成长达一分钟的视频,这在当时的AI视频中是一个重要的突破。 ,展示了AI在创意图像生成方面的能力。 Sora的出现打破了这一局限,它能够根据文本指令生成长达一分钟的视频,这在生成AI领域是一个重大突破,类似于ChatGPT在自然语言处理(NLP)领域的影响。

    2.4K10编辑于 2024-03-13
  • 来自专栏科技云报道

    AI写小说、绘画、剪视频生成AI更火了!

    有观点认为,2022年将是生成AI从技术成熟到深入社会基本面的元年。 生成AI爆发式增长: 从图片到视频 最近几年,AI技术在视觉领域的发展可谓是“神速”。 虽然本质上来说,视频就是一系列图像的叠加,但相比于生成图像,用文字来生成视频时,不仅需要生成相同场景下的多个帧,还要保证相邻帧之间的连贯性。 由于训练模型时可用的高质量视频数据非常少,但计算量却很大,大大增加了视频生成任务的复杂性。 今年9月,来自Meta的研究人员发布了Make-A-Video,这是一个基于人工智能的高质量短视频生成模型,相当于视频版的DALL-E,也被戏称为“用嘴做视频”,即可以通过文本提示创建新的视频内容,其背后使用的关键技术 Phenaki生成视频示例 目前,国内也有不少生成AI的应用。 例如,字节跳动旗下的剪映APP提供AI生成视频功能,并可以免费使用。

    1.9K20编辑于 2022-12-08
  • 来自专栏猫头虎AI技术分享

    快速上手 AIAI 视频与音频生成教程

    快速上手 AIAI 视频与音频生成教程 摘要:随着生成AI的爆发式发展,音视频创作已经从“专业技能”转变为“人人可用”的智能工具。 本文将从==AI音频生成AI视频生成、工具对比、应用实例==四大方向带你快速上手,并附带一键上手代码与流程图可视化讲解。 一、前言:AI视频时代的来临“==AI视频生成==的核心,是用文本驱动声音和画面。” 过去制作视频需要复杂的剪辑与配音软件,如今仅需几行指令或几段文字,AI就能自动生成AI视频:根据脚本、图片或语音自动生成带人物、配音、字幕的视频。 GPT-4o 语音接口 + MoviePy视频叠加,即可生成讲解类AI视频

    4.2K351编辑于 2025-10-06
  • 来自专栏一个程序猿的异常

    Sora AI:如何生成逼真视频,推动创意界限

    文章速览 OpenAI Sora是一个能够生成高质量、连贯流畅视频AI模型, 它能够根据文本描述生成长达1分钟的视频。 总的来说,OpenAI Sora是一个强大的视频生成模型,它能够生成高品质、连贯流畅的视频,支持多镜头切换和复杂场景的生成,同时具备良好的安全性和可靠性。 OpenAI Sora的扩散模型工作原理主要是通过逐步移除视频中的噪声来生成清晰的视频。Sora的起点是类似于静态噪声的视频画面,通过多个步骤逐步去除噪声,最终生成一个清晰的视频画面。 一次性生成视频:Sora的另一个特点是可以生成整个视频,而不是逐帧生成。这种方式避免了其他方法中的挑战,如确保即使对象暂时从视野中消失,也能保持不变。 最后,Sora的这种能力展示了AI技术在电影行业重塑方面的潜力,它可能会改变整个电影产业的生产方式。

    62610编辑于 2024-02-27
  • 混合AI模型秒生成高清流畅视频

    混合AI模型实现秒级高清视频生成研究人员开发出一种名为CausVid的混合人工智能方法,能够在数秒内创建高质量视频。该方法结合了扩散模型和自回归架构,类似于知识渊博的教师指导聪慧学生的学习过程。 技术原理与传统逐帧生成(自回归)或全序列处理(扩散模型)不同,CausVid采用混合方法:使用预训练的扩散模型作为"教师模型"训练自回归的"学生模型"快速预测下一帧确保视频质量和帧间一致性核心功能该工具能够 :根据简单文本提示生成视频片段将静态照片转换为动态场景扩展现有视频长度在生成过程中通过新输入实时修改内容性能表现在测试中,CausVid展现出卓越性能:生成高分辨率10秒视频的速度比竞争对手快100倍在 30秒长视频测试中质量和一致性领先在900多个文本提示测试中获得84.27的最高综合评分在图像质量和真实人类动作等类别中表现最佳应用前景该技术可用于:视频编辑任务辅助实时直播多语言同步视频生成视频游戏内容渲染机器人训练模拟快速生成技术优势相比传统方法 这项技术有望实现小时级甚至无限时长的高稳定性视频生成

    32010编辑于 2025-08-31
  • 来自专栏程序那些事儿

    Runway Gen2:AI视频生成的未来

    Runway Gen2 是一种由 Runway Research 开发的新的文本到视频生成器。它是第一款公开可用的文本到视频模型,能够“真实和一致”地合成新视频。 突破 Gen2 的突破在于它能够生成逼真和一致的视频。这要归功于其使用了一种新的深度学习模型,该模型能够学习从文本和视频中捕捉信息。该模型由一个巨大的数据集训练,该数据集包括图像、视频和文本。 使用方式 Gen2 提供了多种生成视频的方式,你可以直接通过文本描述来生成一段视频,当然,你也可以根据图片和文字的描述来生成视频,此外,你还可以通过对视频进行神奇描绘来生成视频。 配合着类似 midjourney 等图片生成工具,你完全可以制作自己的动画视频。 应用 Gen2 具有广泛的应用前景。它可用于: 创意表达,创建新的艺术作品、视频游戏、电影等。 例如,Gen2 生成视频可能存在偏见或错误。此外,Gen2 可能被用于生成虚假或误导性的视频。 结论 Runway Gen2 是一项具有重要潜力的技术。

    1.1K10编辑于 2023-11-30
  • 来自专栏wayn的程序开发

    用笔记本轻松玩转 AI 生成视频

    最近,在 github 看到了一个名为 FramePack 的图生视频项目,基于预测神经网络结构,可以在资源有限的设备上生成高质量的视频。 它通过将上下文压缩成固定长度,使得生成任务的工作量与视频长度无关,从而实现高效且资源友好的视频生成。 什么是 FramePack? 它通过逐步生成下一帧内容,实现高质量视频的连续输出。与传统的视频扩散模型不同,FramePack 并不受视频长度限制,能够在资源有限的设备上处理成千上万帧的视频生成任务。 渐进式生成 + 可视化反馈 模型采用逐帧或逐段生成的方式,用户可以在生成过程中实时查看当前结果,获得视觉反馈。 即使是生成一分钟以上的长视频,也可以边生成边预览,无需等待全部完成。 Preview) 由于 FramePack 是逐帧或逐段生成的模型,视频会随着每一步推理越来越长。

    1.2K21编辑于 2025-05-01
  • 来自专栏AI科技评论

    视频 | AI实时生成材质,效果直逼好莱坞大片

    我们的卷积神经网络可以提供这些图像的实时预测结果,这些预测与真正的渲染图像难以分辨,并且实时生成AI科技评论按:这里是,雷锋字幕组编译的Two minutes paper专栏,每周带大家用碎片时间阅览前沿技术,了解AI领域的最新研究成果。 而且,我们的卷积神经网络可以提供这些图像的实时预测结果,这些预测与真正的渲染图像难以分辨,并且实时生成视频原址:https://www.youtube.com/watch?v=6FzVhIV_t3s 论文原址:https://arxiv.org/pdf/1804.08369.pdf

    1K30发布于 2018-07-27
  • 来自专栏目标检测和深度学习

    产品体验|AI视频生成产品新体验

    用的Colab里面的V100显卡,没有A100了,16G显存刚好够25帧的视频生成生成时间大概144秒。 就是这个对硬件要求实在太高,希望社区大佬给力一些,优化到可以本地跑。 下面是测试生成视频。 ​ **语言理解和生成**:SEINE能够理解和生成流利、准确的文本,这使它在进行自然语言处理方面特别强大。 6. 演示视频 https://m.okjike.com/originalPosts/655c78daf9a492630b2f88d9 之前说过的 SEINE 视频生成模型,代码已经开源,我自己试 - 即刻 c)油管上的简介和详细介绍视频(需魔法) 演示视频 https://mp.weixin.qq.com/s/HciZfrSQqHl4ZV6ropvexQ 图片变视频只需一“指”!

    50410编辑于 2023-11-27
  • 来自专栏希里安

    虚构世界的建筑师:AI视频生成

    --smart-servlet 3、2024年2月15日,openai发布视频生成大模型sora。可以根据文字描述生成逼真的视频,震惊了很多人。 这里推荐以下百度的飞桨PaddlePaddle学习平台进行入门:https://www.paddlepaddle.org.cn/tutorials 视频生成模型原理浅谈 AI视频生成模型的原理基于机器学习 在视频生成的情况下,这意味着模型学习如何从随机噪声生成结构化的视频帧。 文本条件:这种类型的模型受到输入文本的条件约束。 在视频生成中,Transformer可以被用来理解和生成视频帧的序列,因为视频本质上是一系列图像。 高保真视频生成:模型的最终目标是生成高保真度、高分辨率的视频,这些视频在视觉上令人信服,并能够表现出丰富的动态和物理行为。

    44310编辑于 2024-02-22
  • 来自专栏Java项目实战

    AI绘画专栏stablediffusion AI视频 漫画「Infinigen」AI生成100%还原大自然

     前几天我们还在使用图片转3D动态,现如今就出现了3D场景,长电影生成指日可待,让我们跟随官方的视频开始吧~ 论文地址:https://arxiv.org/pdf/2306.09310.pdf Github Pro, 16GB RAM Blender的前世今生 官网:https://blender.bgteach.com/ Blender是一款开源的3D计算机图形软件,它拥有强大的3D建模、动画、视频后期 这些早期版本主要面向高端工作站和视频卡,功能也比较简单。 今生: 2002年,Blender基金会成立,Ton Roosendaal担任主席,Blender作为一款开源3D软件得到长足发展。 应用:Infinigen可以用于多个领域的人像图片生成: 1. AI头像:Infinigen可以根据用户输入的描述信息生成相应的头像,实现自定义AI头像功能。 2. 它开发的Infinigen可以生成逼真的人像图片。Infinigen和类似的GAN为个性化推荐和生成AI提供了一定技术基础。 2.

    75210编辑于 2023-11-30
  • AI视频生成模型全面对比与技术解析

    对比AI视频模型要跟上每一个新的视频模型发布步伐是困难的。本篇内容将帮助您根据需求选择最佳的模型。分析将分为两个部分:核心模型规格:例如价格、分辨率、时长、帧率、生成速度和发布日期。 生成速度同样是一个从最快到最慢的范围。时间和价格数据截至2025年7月7日。视频生成速度可能会随着模型优化或切换到更好的硬件而提升。 模型价格(每视频)分辨率时长帧率生成速度发布日期某中心 Veo 3$6720p, 1080p8s2492s2025年5月某中心 Veo 3 Fast$3.20720p, 1080p8s2459s2025 ✅ 原生音频❌ 图生视频(起始帧)❌ 图生视频(结束帧)❌ 主体参照某中心 Veo 3 Fast✅ 文生视频✅ 原生音频❌ 图生视频(起始帧)❌ 图生视频(结束帧)❌ 主体参照某中心 Veo 2✅ 文生视频 01 Director✅ 文生视频✅ 图生视频(起始帧)❌ 图生视频(结束帧)❌ 主体参照❌ 原生音频快手 Kling 2.1 (Master)✅ 文生视频✅ 图生视频(起始帧)❌ 图生视频(结束帧)❌

    79410编辑于 2025-12-30
  • 来自专栏Prompt Engineering

    B站视频文案生成指令:让AI帮你写脚本

    这个指令做什么简单说,这是一套给AI用的"工作指南"。你把视频的基本信息告诉AI,它按照B站内容的规律,帮你生成完整的视频脚本框架。 核心逻辑就三步:你提供视频主题、类型、时长等基础信息AI按照B站内容规律生成结构化脚本你根据实际情况调整优化适用场景这个指令适合:知识科普、产品测评、游戏解说、教程类视频创作者需要批量产出内容的团队想提升视频完播率和互动率的 关于调整:AI生成的内容是框架,不是成品。 你需要:把AI生成的"标准话术"改成你自己的说话方式根据实际拍摄素材调整内容顺序删掉那些听起来很AI、不像人说的话加入你的个人观点和真实体验关于数据:指令里的SEO和数据优化建议,可以参考,但B站的推荐算法一直在变 几个坑不要照搬:AI生成的文案往往"正确但无聊",缺少个人特色,照搬会让视频失去灵魂注意时效:AI的知识有时间限制,它提到的热梗可能已经过时,需要你自己判断风格问题:如果你的频道已经有明确的个人风格,这个指令可能会让文案显得

    96310编辑于 2025-10-19
  • 来自专栏算法一只狗

    你真的能够识别AI生成的图片和视频吗?

    真实答案是右边的是真实的图片,左边是AI生成的。为了验证到底目前AI生成能力有多强,有网友制作了一个网站“an AI video quiz”,用来测试到底人类能不能给识别出AI生成视频。 只能感叹,AI如果真的要骗我,有时候真的是毫无破绽。而且普通人对于这种AI生成视频可能更加难以识别。 现在AI生成视频简直是肉眼都分不出来的地步,同时语音合成、语音和口型对比、换脸技术等等已经有了明显的进步,这就更加使得普通人更加难以识别这些生成视频了。同时这种视频制作,在网上可以找到一堆教程。 这里教给大家几个方法,看怎么识别出是AI生成的图片或者视频。第一个就是看,不自然的面部细节。比如在视频中,人物的嘴部动作不自然和不连贯。 AI生成的图片可能无法正确渲染复杂的光影或反射效果,导致画面看起来不真实。比如下面这个画面中,两个人物反射出来的光源并不相同。最后还有一个就是,AI生成视频会频繁重复某种动作。

    1.7K20编辑于 2024-10-31
  • 来自专栏新智元

    AI编曲震撼人心,RNN生成流行音乐(视频

    【新智元导读】AI 和音乐的结合已经成为一个新兴的行业,AI 编曲的《Free Break》风靡一时,它的成功,在于“AI+HI”的合作。 AI 和音乐的结合,这是一个新兴的行业。 摘要: 我们提出了一个生成流行音乐的新框架。我们的模型是层次循环神经网络,层和结构中编码了关于流行音乐如何构成的先验知识。具体来说,底层生成旋律(melody),较高层生成节奏与和弦。 我们进行的实验表明,与用谷歌最近的方法生成的音乐相比,人类受试者明显更偏爱我们生成的音乐。另外,我们还展示了新框架的两种应用:神经舞蹈和卡拉OK,以及神经歌谣。 周博磊还说:“论文里面还展示了一些应用,比如说生成音乐的过程中同时生成跳舞的小人(如下图),以及尝试用 neural image captioning的办法生成歌词或者朗诵,这些应用都给未来提出了无限可能性

    2.3K50发布于 2018-03-22
领券