首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏开源心路

    AI生成视频-Pika

    背景介绍 Pika 是一个使用 AI 生成和编辑视频的平台。它致力于通过 AI 技术使视频制作变得简单和无障碍。 Pika 1.0 是 Pika 的一个重大产品升级,包含了一个新的 AI 模型,可以在各种风格下生成和编辑视频,如 3D 动画,动漫,卡通和电影风格。 大拇指向下 告诉机器人(和 Pika 实验室团队)Pika 做了一些丑陋、错误的东西,或者视频完全没有移动。 重新生成 - 重复提示 使用相同的提示词和参数再生成一个视频。 现在我们需要告诉 AI 实际上我们想要生成什么样的片段。 我们很高兴推出 Pika 1.0,这是一次重大的产品升级,包括一个新的 AI 模型,它能够以 3D 动画、动漫、卡通和电影等各种样式生成和编辑视频,以及一个新的 Web 体验,使其更容易使用。

    2K10编辑于 2023-12-06
  • 来自专栏全栈技术

    AI视频制作一本通:文本生成视频、图片生成视频视频生成视频

    第一部分:文本生成视频1. 文本生成视频概述随着人工智能(AI)技术的飞速发展,视频制作领域也迎来了创新的浪潮。文本生成视频是其中的一项令人激动的进展,它利用自然语言处理技术将文本内容转化为视频。 video = CompositeVideoClip([background_image.set_duration(10), text_clip.set_duration(10).set_position ('center'), audio_clip.set_duration(10)])video.write_videofile("output_video.mp4", codec='libx264')此示例中 1080)# 步骤3:编码图片序列video = ImageSequenceClip(image_sequence, fps=frame_rate)video = video.set_duration(10 第三部分:视频生成视频1. 视频生成视频原理视频生成视频是一种使用人工智能技术合成新视频的方法。它借助生成对抗网络(GANs)和深度学习模型,可以用于各种应用,包括电影特效、艺术实验和视频内容生成

    3.4K62编辑于 2023-11-07
  • 来自专栏算法一只狗

    AI解决生成视频“闪烁”问题

    在上一期中,我曾经介绍了用ControlNet结合Mov2Mov插件生成新的视频。虽然它能够快速的对视频中的人物进行转换,但是还存在难以解决的闪烁问题。 造成闪烁的原因很简单,是因为AI是一帧一帧生成图片然后再合成的,所有每张图片本质上不太连贯,最后就会造成视频闪烁的出现。但是这个难题近期被南洋理工大学的团队很好的解决。 首先来看看他们生成视频效果:可以看到,生成视频很丝滑,而且人物的动作衔接的很连贯。 利用上面的方法进行生成后,在连续的十几秒中,每一幅图片的细节都生成相似,就能够有效缓解视频闪烁的情况出现。 下图是作者对比Stable-Diffusion的结果:当然,在不同的模型比较上,该作者提出的方法在生成视频的稳定性上效果明显提高:同时,在输入文本中仅需更改几个词语,在视频背景保持不变的情况下,可以不断的调节视频中的细节

    87920编辑于 2024-10-10
  • 来自专栏音视频技术

    AI自动剪辑生成视频探索实践

    文/赵剑 整理/LiveVideoStack 大家好,我是赵剑,来自网易云音乐,本次分享的主题是AI自动剪辑生成视频的探索实践,内容主要分为以下几个部分:  What — 什么是AI自动生成音乐视频? Why — 为什么需要基于AI自动生成音乐视频?  How — 如何实现AI自动生成音乐视频? 首先为大家播放由三段不同类型的音乐视频,全程无人工参与,完全通过AI自动生成。 以上三个视频都由我们的音视频实验室“AI一键自动生成”音乐视频系统生成,它整合了音乐、视频、文本等相关的原子算法,从音乐内容及视频内容两部分进行分析,多模态、多角度地全自动生成音乐视频,助力音乐视频的创作 1、Why音乐视频自动化剪辑生成 接下来正式为大家介绍AI自动剪辑生成视频的探索实践。 首先,为什么做音乐视频自动生成? 2、AI自动剪辑生成音乐视频系统 其次,如何搭建高效自动生成音乐视频的系统?

    3.4K21编辑于 2023-04-04
  • 来自专栏翩翩白衣少年

    MuseV:不限视频时长的AI视频生成工具

    在不久前 OpenAI Sora 以其优秀且惊人的视频生成效果迅速走红,更是在一众文生视频模型中脱颖而出,成为了文生视频领域的领头羊。 同时它也推动了行业内文生视频技术的发展。 今天小编为大家分享一款新开源的文生视频项目MuseV,据说可以生成不限时长的AI视频。 项目背景 MuseV 项目在2023年7月就已经实现了,但是受到近期 Sora 进展的启发,才决定开源出来。 项目介绍 MuseV 是一个基于扩散模型的虚拟人视频生成框架。它采用了新颖的视觉条件并行去噪方案,支持无限长度视频生成。 在更大、更高分辨率、更高质量的文本视频数据集上进行训练可能会使 MuseV 更好。 • 有限类型的长视频生成。视觉条件并行去噪可以解决视频生成的累积误差,但当前的方法只适用于相对固定的摄像机场景。 总结 MuseV 以其无限长度视频生成以及对 Stable Diffusion 生态的支持以及多参考图像技术,成为视频生成领域的新兴力量。

    1.9K10编辑于 2024-04-13
  • ai生成PPT网站有哪些?10AI 生成 PPT 网站大盘点

    1、AiPPTAiPPT 是国内较早专注于 AI 生成 PPT 的平台之一,凭借其简洁易用的操作界面和强大的智能生成能力,赢得了众多用户的青睐。 Prezi AI 的核心功能是 “智能动态路径生成”:用户输入 PPT 的主题、核心内容模块以及各模块之间的逻辑关系后,AI 会自动生成动态演示路径,确定页面之间的跳转顺序和缩放效果,让演示过程更流畅、 此外,Focusky AI 支持在线编辑,用户可以调整 3D 场景、修改内容、添加交互效果(如点击跳转、动画触发等),还能将 PPT 导出为 EXE、HTML5、视频、PDF 等多种格式,满足不同的演示需求 10、讯飞智文科大讯飞推出的讯飞智文,支持文本、语音、视频指令生成PPT,并可同步生成配套演讲稿。其智能动效功能自动为图表添加动态过渡效果,适合会议场景快速记录。 总结以上介绍的 10AI 生成 PPT 网站(含 AI 辅助 PPT 功能的平台),涵盖了不同的功能特色、适用场景和操作风格,从专门的 AI 生成 PPT 工具(如 AiPPT)到集成 AI 功能的综合设计平台

    2.9K11编辑于 2025-09-02
  • 来自专栏程序大视界

    2026国产AI视频生成工具推荐

    Sora关停、国产崛起:2026年AI视频生成工具格局大洗牌! OpenAI于2026年3月24日正式关停Sora,AI视频生成市场迎来了历史性的转折点。国产工具如何抓住机遇?创作者该何去何从? 01 — OpenAI挥刀斩Sora 2026年3月24日,OpenAI正式宣布关停Sora独立App、API接口及ChatGPT内置视频功能,全面退出消费级AI视频生成市场。 迪士尼也同步终止了原本计划的10亿美元投资合作。 知识分享、生活记录 单次12秒 海螺AI 创意元素生成、动画风格出色 创意短视频、动画制作 约6秒 Vidu 生成稳定、速度适中 通用场景 约4秒 实测数据对比 根据CSDN博主测评数据,在生成速度方面 分段生成视频:单次生成时间有限,可以分段生成再拼接 关注高峰期:国产工具在下午3-6点可能出现排队,错峰使用效率更高 06 — 未来展望 AI视频生成市场正在经历剧烈变革: 技术层面:可控性、一致性

    2.3K20编辑于 2026-04-10
  • 来自专栏AI算法能力提高班

    Sora | 最强AI视频生成大模型

    [AI Milestone] Sora | 2024年最强AI视频生成大模型 本文主要从Sora的诞生背景、技术原理、能力演示、应用前景和变现思路等多个角度进行介绍这一划时代的最新视频生成技术。 然而,早期的AI视频通常存在一些限制,如视频长度有限(通常只有几秒钟),场景逼真度不足,元素突然出现或消失,以及运动不连贯等问题,这些问题使得视频内容容易被识别为AI生成。 OpenAI发布的Sora模型在演示视频中展示了显著的进步,其生成视频内容在质量上几乎无法被察觉为AI制作。Sora能够生成长达一分钟的视频,这在当时的AI视频中是一个重要的突破。 ,展示了AI在创意图像生成方面的能力。 Sora的出现打破了这一局限,它能够根据文本指令生成长达一分钟的视频,这在生成AI领域是一个重大突破,类似于ChatGPT在自然语言处理(NLP)领域的影响。

    2.6K10编辑于 2024-03-13
  • 来自专栏量子位

    谷歌发布“Vlogger”模型:单张图片生成10视频

    谷歌发布了一个新的视频框架: 只需要一张你的头像、一段讲话录音,就能得到一个本人栩栩如生的演讲视频视频时长可变,目前看到的示例最高为10s。 可以看到,无论是口型还是面部表情,它都非常自然。 嗯,拍一张肖像,录好演讲音频就可以(手动狗头) 用声音控制肖像生成视频 这个框架名叫VLOGGER。 而和业内此前的同类方法相比,VLOGGER最大的优势则体现在不需要对每个人进行训练、也不依赖于面部检测和裁剪,并且生成视频很完整(既包括面部和唇部,也包括肢体动作)等等。 具体来看,如下表所示: Face Reenactment方法无法用音频和文本来控制此类视频生成。 Audio-to-motion倒是可以音频生成,方式也是将音频编码为3D人脸动作,不过它生成的效果不够逼真。 Lip sync可以处理不同主题的视频,但只能模拟嘴部动作。

    54410编辑于 2024-03-21
  • 来自专栏科技云报道

    AI写小说、绘画、剪视频生成AI更火了!

    作为AI发展的一个重要方向,生成AI具有非常大的发展潜力。 据Gartner上半年的数据,预计到 2025 年,生成AI将占所有生成数据的10%,当前这一比例不到1%。 有观点认为,2022年将是生成AI从技术成熟到深入社会基本面的元年。 生成AI爆发式增长: 从图片到视频 最近几年,AI技术在视觉领域的发展可谓是“神速”。 虽然本质上来说,视频就是一系列图像的叠加,但相比于生成图像,用文字来生成视频时,不仅需要生成相同场景下的多个帧,还要保证相邻帧之间的连贯性。 由于训练模型时可用的高质量视频数据非常少,但计算量却很大,大大增加了视频生成任务的复杂性。 Phenaki生成视频示例 目前,国内也有不少生成AI的应用。 例如,字节跳动旗下的剪映APP提供AI生成视频功能,并可以免费使用。

    2K20编辑于 2022-12-08
  • 来自专栏猫头虎AI技术分享

    快速上手 AIAI 视频与音频生成教程

    快速上手 AIAI 视频与音频生成教程 摘要:随着生成AI的爆发式发展,音视频创作已经从“专业技能”转变为“人人可用”的智能工具。 本文将从==AI音频生成AI视频生成、工具对比、应用实例==四大方向带你快速上手,并附带一键上手代码与流程图可视化讲解。 一、前言:AI视频时代的来临“==AI视频生成==的核心,是用文本驱动声音和画面。” 过去制作视频需要复杂的剪辑与配音软件,如今仅需几行指令或几段文字,AI就能自动生成AI视频:根据脚本、图片或语音自动生成带人物、配音、字幕的视频。 GPT-4o 语音接口 + MoviePy视频叠加,即可生成讲解类AI视频

    4.7K351编辑于 2025-10-06
  • 来自专栏一个程序猿的异常

    Sora AI:如何生成逼真视频,推动创意界限

    文章速览 OpenAI Sora是一个能够生成高质量、连贯流畅视频AI模型, 它能够根据文本描述生成长达1分钟的视频。 总的来说,OpenAI Sora是一个强大的视频生成模型,它能够生成高品质、连贯流畅的视频,支持多镜头切换和复杂场景的生成,同时具备良好的安全性和可靠性。 OpenAI Sora的扩散模型工作原理主要是通过逐步移除视频中的噪声来生成清晰的视频。Sora的起点是类似于静态噪声的视频画面,通过多个步骤逐步去除噪声,最终生成一个清晰的视频画面。 一次性生成视频:Sora的另一个特点是可以生成整个视频,而不是逐帧生成。这种方式避免了其他方法中的挑战,如确保即使对象暂时从视野中消失,也能保持不变。 最后,Sora的这种能力展示了AI技术在电影行业重塑方面的潜力,它可能会改变整个电影产业的生产方式。

    68010编辑于 2024-02-27
  • 混合AI模型秒生成高清流畅视频

    混合AI模型实现秒级高清视频生成研究人员开发出一种名为CausVid的混合人工智能方法,能够在数秒内创建高质量视频。该方法结合了扩散模型和自回归架构,类似于知识渊博的教师指导聪慧学生的学习过程。 技术原理与传统逐帧生成(自回归)或全序列处理(扩散模型)不同,CausVid采用混合方法:使用预训练的扩散模型作为"教师模型"训练自回归的"学生模型"快速预测下一帧确保视频质量和帧间一致性核心功能该工具能够 :根据简单文本提示生成视频片段将静态照片转换为动态场景扩展现有视频长度在生成过程中通过新输入实时修改内容性能表现在测试中,CausVid展现出卓越性能:生成高分辨率10视频的速度比竞争对手快100倍在 30秒长视频测试中质量和一致性领先在900多个文本提示测试中获得84.27的最高综合评分在图像质量和真实人类动作等类别中表现最佳应用前景该技术可用于:视频编辑任务辅助实时直播多语言同步视频生成视频游戏内容渲染机器人训练模拟快速生成技术优势相比传统方法 这项技术有望实现小时级甚至无限时长的高稳定性视频生成

    38010编辑于 2025-08-31
  • 来自专栏程序那些事儿

    Runway Gen2:AI视频生成的未来

    Runway Gen2 是一种由 Runway Research 开发的新的文本到视频生成器。它是第一款公开可用的文本到视频模型,能够“真实和一致”地合成新视频。 突破 Gen2 的突破在于它能够生成逼真和一致的视频。这要归功于其使用了一种新的深度学习模型,该模型能够学习从文本和视频中捕捉信息。该模型由一个巨大的数据集训练,该数据集包括图像、视频和文本。 使用方式 Gen2 提供了多种生成视频的方式,你可以直接通过文本描述来生成一段视频,当然,你也可以根据图片和文字的描述来生成视频,此外,你还可以通过对视频进行神奇描绘来生成视频。 配合着类似 midjourney 等图片生成工具,你完全可以制作自己的动画视频。 应用 Gen2 具有广泛的应用前景。它可用于: 创意表达,创建新的艺术作品、视频游戏、电影等。 例如,Gen2 生成视频可能存在偏见或错误。此外,Gen2 可能被用于生成虚假或误导性的视频。 结论 Runway Gen2 是一项具有重要潜力的技术。

    1.2K10编辑于 2023-11-30
  • 来自专栏猫头虎博客专区

    智谱新清影正式发布,生成 10 秒 4K60 帧 AI 视频

    智谱新清影正式发布,生成 10 秒 4K60 帧 AI 视频 大家好,我是猫头虎! 今天给大家带来一条劲爆消息,智谱技术团队的最新大招——新清影,一款支持4K超清视频生成并自带音效的AI视频生成神器正式发布! 本次升级让 AI 视频生成不再局限于“无声电影”,从此视频不仅有“画”还有“声”!️ 超清画质:支持生成10秒、4K、60帧的超高清视频,画质达到了影像新高!高清画面+流畅帧率,让视频体验更上一层楼! 从图像生成视频视频与音效的完美结合,新清影不仅开创了视频生成的新时代,还让AI视频的可能性大大扩展。 这意味着AI不再只是“制作画面”,它开始理解“画面+声音”的综合表达。 如何从行业中受益?

    86810编辑于 2024-11-11
  • 来自专栏AI科技评论

    视频 | AI实时生成材质,效果直逼好莱坞大片

    我们的卷积神经网络可以提供这些图像的实时预测结果,这些预测与真正的渲染图像难以分辨,并且实时生成AI科技评论按:这里是,雷锋字幕组编译的Two minutes paper专栏,每周带大家用碎片时间阅览前沿技术,了解AI领域的最新研究成果。 而且,我们的卷积神经网络可以提供这些图像的实时预测结果,这些预测与真正的渲染图像难以分辨,并且实时生成视频原址:https://www.youtube.com/watch?v=6FzVhIV_t3s 论文原址:https://arxiv.org/pdf/1804.08369.pdf

    1K30发布于 2018-07-27
  • 来自专栏wayn的程序开发

    用笔记本轻松玩转 AI 生成视频

    最近,在 github 看到了一个名为 FramePack 的图生视频项目,基于预测神经网络结构,可以在资源有限的设备上生成高质量的视频。 它通过将上下文压缩成固定长度,使得生成任务的工作量与视频长度无关,从而实现高效且资源友好的视频生成。 什么是 FramePack? 它通过逐步生成下一帧内容,实现高质量视频的连续输出。与传统的视频扩散模型不同,FramePack 并不受视频长度限制,能够在资源有限的设备上处理成千上万帧的视频生成任务。 渐进式生成 + 可视化反馈 模型采用逐帧或逐段生成的方式,用户可以在生成过程中实时查看当前结果,获得视觉反馈。 即使是生成一分钟以上的长视频,也可以边生成边预览,无需等待全部完成。 帧(优化后) RTX 3070 Ti / 3060 笔记本 6~10 秒/帧 如果你发现生成速度远慢于以上数据,建议检查是否启用了正确的注意力优化模块(如 Flash Attention、SageAttention

    1.5K21编辑于 2025-05-01
  • 来自专栏希里安

    虚构世界的建筑师:AI视频生成

    --smart-servlet 3、2024年2月15日,openai发布视频生成大模型sora。可以根据文字描述生成逼真的视频,震惊了很多人。 这里推荐以下百度的飞桨PaddlePaddle学习平台进行入门:https://www.paddlepaddle.org.cn/tutorials 视频生成模型原理浅谈 AI视频生成模型的原理基于机器学习 在视频生成的情况下,这意味着模型学习如何从随机噪声生成结构化的视频帧。 文本条件:这种类型的模型受到输入文本的条件约束。 在视频生成中,Transformer可以被用来理解和生成视频帧的序列,因为视频本质上是一系列图像。 高保真视频生成:模型的最终目标是生成高保真度、高分辨率的视频,这些视频在视觉上令人信服,并能够表现出丰富的动态和物理行为。

    47110编辑于 2024-02-22
  • 来自专栏目标检测和深度学习

    产品体验|AI视频生成产品新体验

    用的Colab里面的V100显卡,没有A100了,16G显存刚好够25帧的视频生成生成时间大概144秒。 就是这个对硬件要求实在太高,希望社区大佬给力一些,优化到可以本地跑。 下面是测试生成视频。 ​ **语言理解和生成**:SEINE能够理解和生成流利、准确的文本,这使它在进行自然语言处理方面特别强大。 6. 演示视频 https://m.okjike.com/originalPosts/655c78daf9a492630b2f88d9 之前说过的 SEINE 视频生成模型,代码已经开源,我自己试 - 即刻 c)油管上的简介和详细介绍视频(需魔法) 演示视频 https://mp.weixin.qq.com/s/HciZfrSQqHl4ZV6ropvexQ 图片变视频只需一“指”!

    54410编辑于 2023-11-27
  • 来自专栏Java项目实战

    AI绘画专栏stablediffusion AI视频 漫画「Infinigen」AI生成100%还原大自然

     前几天我们还在使用图片转3D动态,现如今就出现了3D场景,长电影生成指日可待,让我们跟随官方的视频开始吧~ 论文地址:https://arxiv.org/pdf/2306.09310.pdf Github Pro, 16GB RAM Blender的前世今生 官网:https://blender.bgteach.com/ Blender是一款开源的3D计算机图形软件,它拥有强大的3D建模、动画、视频后期 这些早期版本主要面向高端工作站和视频卡,功能也比较简单。 今生: 2002年,Blender基金会成立,Ton Roosendaal担任主席,Blender作为一款开源3D软件得到长足发展。 应用:Infinigen可以用于多个领域的人像图片生成: 1. AI头像:Infinigen可以根据用户输入的描述信息生成相应的头像,实现自定义AI头像功能。 2. 它开发的Infinigen可以生成逼真的人像图片。Infinigen和类似的GAN为个性化推荐和生成AI提供了一定技术基础。 2.

    80610编辑于 2023-11-30
领券