首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏程序那些事儿

    Runway Gen2AI视频生成的未来

    Runway Gen2 是一种由 Runway Research 开发的新的文本到视频生成器。它是第一款公开可用的文本到视频模型,能够“真实和一致”地合成新视频。 使用方式 Gen2 提供了多种生成视频的方式,你可以直接通过文本描述来生成一段视频,当然,你也可以根据图片和文字的描述来生成视频,此外,你还可以通过对视频进行神奇描绘来生成视频。 配合着类似 midjourney 等图片生成工具,你完全可以制作自己的动画视频。 应用 Gen2 具有广泛的应用前景。它可用于: 创意表达,创建新的艺术作品、视频游戏、电影等。 例如,您可以使用 Gen2 创建一段视频宣传您的新产品或服务 挑战 Gen2 仍在开发中,但它已经显示出巨大的潜力。随着模型的改进,Gen2 将能够生成更加逼真和逼真的视频。 然而,Gen2 也面临一些挑战。例如,Gen2 生成的视频可能存在偏见或错误。此外,Gen2 可能被用于生成虚假或误导性的视频。 结论 Runway Gen2 是一项具有重要潜力的技术。

    1.1K10编辑于 2023-11-30
  • 来自专栏CVer

    仅需2张图!AI便可生成完整运动过程

    再给一张正脸(关键帧2): ? 然后仅仅根据这两张图片,AI处理了一下,便能生成整个运动过程: ? 而且不只是简单的那种,连在运动过程中的眨眼动作也“照顾”得很到位。 仅需2个关键帧,如何实现完整运动? 不需要冗长的训练过程。 不需要大量的训练数据集。 这是论文作者对本次工作提出的两大亮点。 具体而言,这项工作就是基于关键帧将视频风格化。 从原始关键帧(Ik)中随机抽取一组图像块(a),在网络中生成它们的风格化对应块(b)。 然后,计算这些风格化对应块(b)相对于从风格化关键帧(Sk)中取样对应图像块的损失,并对误差进行反向传播。 对于每一个超参数设置: (1)执行给定时间训练; (2)对不可见帧进行推理; (3)计算推理出的帧(O4)和真实值(GT4)之间的损失。 而目标就是将这个损失最小化。 ? //www.reddit.com/r/MachineLearning/comments/n3b1m6/r_fewshot_patchbased_training_siggraph_2020_dr/ [2]

    70330发布于 2021-05-10
  • 来自专栏量子位

    仅需2张图,AI便可生成完整运动过程

    再给一张正脸(关键帧2): ? 然后仅仅根据这两张图片,AI处理了一下,便能生成整个运动过程: ? 而且不只是简单的那种,连在运动过程中的眨眼动作也“照顾”得很到位。 仅需2个关键帧,如何实现完整运动? 不需要冗长的训练过程。 不需要大量的训练数据集。 这是论文作者对本次工作提出的两大亮点。 具体而言,这项工作就是基于关键帧将视频风格化。 从原始关键帧(Ik)中随机抽取一组图像块(a),在网络中生成它们的风格化对应块(b)。 然后,计算这些风格化对应块(b)相对于从风格化关键帧(Sk)中取样对应图像块的损失,并对误差进行反向传播。 对于每一个超参数设置: (1)执行给定时间训练; (2)对不可见帧进行推理; (3)计算推理出的帧(O4)和真实值(GT4)之间的损失。 而目标就是将这个损失最小化。 ? //www.reddit.com/r/MachineLearning/comments/n3b1m6/r_fewshot_patchbased_training_siggraph_2020_dr/ [2]

    1K20发布于 2021-05-11
  • 来自专栏云头条

    英伟达GauGAN2 AI:用户输入文本字符,AI就会实时生成图景

    英伟达的GauGAN2 AI现在可以使用简单的书写短语来生成相应的逼真图像。该深度学习模型仅用三四个单词就能够生成不同的场景。 GauGan2在单单一个模型中结合了分割图、图像修复以及文本到图像生成,英伟达表示,这使其成为一种功能强大的工具,让用户可以通过结合单词和图画即可创作逼真的艺术作品。 目的是更快捷、更轻松地将艺术家的奇思妙想转化为AI生成的高质量图像。英伟达表示,与其他专门用于文本到图像或分割图到图像等应用的最先进模型相比,GauGAN2可以生成一系列图像,种类更多、质量更高。 GauGAN2背后的AI模型在1000万个高质量的风景图像上使用英伟达Selene超级计算机加以训练,这个英伟达DGX SuperPOD系统跻身全球功能最强大的十大超级计算机行列。 这是用户输入短语“俯瞰一座白色沙滩的热带岛屿”后AI生成的图像。 虽然生成逼真的图像可能最令人印象深刻,但GauGAN2并不仅限于这种娱乐。艺术家们还可以使用演示版来描绘超凡脱俗的虚构风景。

    83920编辑于 2022-03-18
  • 来自专栏ATYUN订阅号

    利用AI 生成商标

    最新的尝试是生成一个对抗网络(GAN)——由样本生成器和鉴别器组成,它们可以区分生成的样本和真实世界的样本。 然后他们使用谷歌的云视觉服务生成4到8个描述标识内容的单词标签,并使用预先训练的人工智能模型对这些标签进行矢量化,为每个示例创建空间表示。之后再对这些空间表征进行聚类,以识别具有相似视觉特征的特征。

    2.9K20发布于 2019-10-08
  • 来自专栏开源心路

    AI生成视频-Pika

    背景介绍 Pika 是一个使用 AI 生成和编辑视频的平台。它致力于通过 AI 技术使视频制作变得简单和无障碍。 Pika 1.0 是 Pika 的一个重大产品升级,包含了一个新的 AI 模型,可以在各种风格下生成和编辑视频,如 3D 动画,动漫,卡通和电影风格。 在这个命令中,你通常看到的 “+1 more” 变成了 “+2 more”,因为这个命令有两个额外的选项。 首先,你需要填写 “message” 栏。这是 PIKA 将用作你生成内容中的元素的文本。 现在我们需要告诉 AI 实际上我们想要生成什么样的片段。 我们很高兴推出 Pika 1.0,这是一次重大的产品升级,包括一个新的 AI 模型,它能够以 3D 动画、动漫、卡通和电影等各种样式生成和编辑视频,以及一个新的 Web 体验,使其更容易使用。

    1.9K10编辑于 2023-12-06
  • 来自专栏自学气象人

    生成AI 简介

    由此可见,生成模型比判别模型要困难很多。 2. 生成模型的框架 了解生成模型框架之前,让我们先玩一个游戏。 假设下图的点是由某种规则产生,我们称该规则为 pdata,现在让你生成一个不同的 x = (x1, x2) 使得这个点看起来是由相同的规则 pdata 产生的。 你会如何生成这个点? 现在我们来一个个检查 50 个数据,然后更新该模型的参数 (θ1, θ2, ... 如果我们尝试使用这样的模型来生成梵高的画,那么它会以相同概率来操作一下两种画: 1. 梵高原作的复制画 (不在原始数据集) 2. 相信你不会说你图像中像素 1 的颜色是黑,像素 2 的颜色是淡黑,像素 3 的颜色是灰等等。

    67310编辑于 2023-09-05
  • 来自专栏王的机器

    生成AI 简介

    由此可见,生成模型比判别模型要困难很多。 2. 生成模型的框架 了解生成模型框架之前,让我们先玩一个游戏。 假设下图的点是由某种规则产生,我们称该规则为 pdata,现在让你生成一个不同的 x = (x1, x2) 使得这个点看起来是由相同的规则 pdata 产生的。 你会如何生成这个点? 现在我们来一个个检查 50 个数据,然后更新该模型的参数 (θ1, θ2, ... 如果我们尝试使用这样的模型来生成梵高的画,那么它会以相同概率来操作一下两种画: 1. 梵高原作的复制画 (不在原始数据集) 2. 相信你不会说你图像中像素 1 的颜色是黑,像素 2 的颜色是淡黑,像素 3 的颜色是灰等等。

    68330编辑于 2023-09-02
  • 来自专栏编码如写诗

    微软深夜炸场:Sora 2全员免费+无限生成AI视频创作

    微软将Sora 2的强大能力封装在最简单的交互中,让专业级视频创作的门槛降至零。 2. 自带音效的视频生成 Sora 2最大的突破在于原生视听整合。 通过免费AI视频生成,微软可以: 增加必应应用的日活和留存 收集海量用户生成内容,用于模型训练 扩大Microsoft Rewards生态的影响力 对抗谷歌在AI搜索领域的竞争 2. 成本控制的技术逻辑 AI视频生成是算力密集型任务。Sora 2生成一段5秒视频,需要消耗大量GPU算力。微软如何承担"无限慢速生成"的成本? 标识内容为AI生成 提供可验证的内容来源 C2PA是由Adobe、微软、英特尔、OpenAI等科技公司联合发起的开放标准,旨在为数字内容建立来源可信性体系。 行业监管的跟进 随着AI视频生成技术的普及,行业监管需要同步推进: 技术标准 制定AI生成内容的技术标准和标识规范 推广C2PA等行业标准的应用 建立内容溯源和验证机制 法律法规 明确AI生成内容的版权归属

    36410编辑于 2026-03-27
  • 来自专栏机器学习炼丹术

    生成专题2 | 图像生成评价指标FID

    FID依然是表示生成图像的多样性和质量,为什么FID越小,则图像多样性越好,质量越好。 FID的计算器中,我们也是用了inception network网络。 对于我们已经拥有的真实图片,所有真实图片的提取的向量是服从一个分布的;对于用GAN生成的图片对应的高位向量特征也是服从一个分布的。如果两个分布相同,那么意味着GAN生成图片的真实程度很高。 x和g表示真实的图片和生成的图片, 表示均值, 是协方差矩阵。 较低的FID表示两个分布更为接近。 sigma2 = act2.mean(axis=0), cov(act2, rowvar=False) # calculate sum squared difference between means random(10*2048) act2 = act2.reshape((10,2048)) # fid between act1 and act1 fid = calculate_fid(act1,

    3.6K20编辑于 2022-03-15
  • 来自专栏慕枫技术笔记

    深入理解生成AI技术原理:初识生成AI

    真正的大师永远怀着一颗学徒的心 如果将人工智能按照用途进行简单分类的话,人工智能可以划分为决策式AI以及生成AI两类。 而以ChatGPT为代表的生成AI通过对大量数据的联合概率进行学习,对已有的数据和知识进行归纳总结,同时结合深度学习技术,自动生成新的内容,而新生成的内容可以是文字、图片甚至是视频等多模态内容。 深度学习 深度学习是生成AI背后比较核心的实现技术,它是机器学习的重要优化手段,而机器学习又是人工智能领域重要的落地实现措施。 总结 本文主要对生成AI进行了初步阐述,同时针对生成AI最核心的两个技术点分别进行了初步说明,后面的专栏文章中将继续以深度学习以及大模型核心技术点作为切入点来深入分析生成AI背后的技术原理。 希望通过系列文章的说明,让大家对于类似ChatGPT这样的生成AI有一个更加深刻的理解。 如何优雅的消除系统重复代码 大厂面试官眼中的好简历到底什么样?

    2.3K30编辑于 2023-08-10
  • 来自专栏DevOps

    AI生成AI & Gemmi模型介绍

    AI 人工智能 (AI) 被认为是机器(尤其是计算机系统)对人类智能过程的模拟。这些过程包括学习(获取信息和使用信息的规则)、推理(使用规则得出近似或明确的结论)和自我纠正。 生成AI 生成式人工智能最近变得非常流行,它被大众用来生成不同类型的内容,包括文本、图像、视频等。 生成AI 是人工智能 (AI) 技术的一个子集,专注于根据输入数据或从现有数据中学习的模式生成新的原创内容。 与专为分类或预测等特定任务而设计的传统 AI 模型不同,生成AI 模型能够创建全新的数据样本,这些样本类似于它们所接触的训练数据。它使用生成模型,这些模型根据现有数据的学习概率分布生成新内容。 在这里,我们开发了用于不同领域的不同 AI 工具列表。 参考:What is Artificial Intelliegence? - DEV Community

    93310编辑于 2024-05-06
  • 来自专栏技术分享

    智谱AI:CogVideoX-2b——视频生成模型的得力工具

    智谱AI公布了一项激动人心的技术创新:他们决定将他们开发的视频生成模型CogVideoX的源代码对外公开。 生成的视频长度可以达到6秒钟,以每秒8帧的速度播放,分辨率则为720像素乘以480像素。虽然这只是一个初步的版本,但智谱AI已经透露,他们正在开发性能更优越、参数量更大的后续版本。 这种技术能够将视频数据的体积压缩到原来的2%,极大地减少了处理视频所需的计算资源,同时保持了视频帧与帧之间的连贯性。这种技术的应用有效避免了在视频生成过程中可能出现的闪烁现象,保证了视频的流畅播放。 这样的设计使得生成的视频序列更加流畅和连贯,提高了观看体验。 在提高视频生成的可控性方面,智谱AI开发了一个端到端的视频理解模型。这个模型能够为视频数据生成精确且与视频内容紧密相关的描述。 -xf CogVideoX-2b.tar 四、开始运行 一切准备就绪后,可以开始运行CogVideoX。

    64310编辑于 2024-09-24
  • 来自专栏开源心路

    AI生成中Transformer模型

    文本生成:如GPT系列模型,在自动内容创作、对话生成等方面具有显著效果。 文本理解:如BERT模型,用于情感分析、文本分类、问答系统等。 语音处理:Transformer被用于语音识别和语音合成。 图像处理:虽然最初是为NLP设计的,但Transformer也已被适配用于图像分类和生成任务。 生物信息学:用于蛋白质结构预测等复杂任务。 视频处理:用于视频理解和视频生成任务。 注意力机制允许解码器在生成每个输出元素时“关注”输入序列中的不同部分,从而有效地解决信息压缩的问题。 这样,解码器可以直接访问整个输入序列,从而更准确地生成输出。 对于给定的输入 ( X ),逐位置前馈网络的计算可以表示为: \text{FFN}(X) = \max(0, XW_1 + b_1)W_2 + b_2 这里, ( W_1 ) 和 ( W_2 ) ,避免参照还未生成的词。

    1.2K11编辑于 2023-12-20
  • 来自专栏AI工具大盘点

    AI Logo 生成技术解析

    AI 技术蓬勃发展的当下,其应用已渗透至品牌设计领域,AI Logo 生成这一创新应用应运而生。 一、AI Logo 生成技术解析(一)算法基础AI Logo 生成工具主要依赖深度学习中的生成对抗网络(GAN)和变分自编码器(VAE)等技术。以 GAN 为例,它由生成器和判别器两部分组成。 2、LogoMaker技术特点 :通过简单的参数设置(品牌名称、行业、颜色、字体等),利用其内置的设计模板和智能布局算法,快速生成 Logo。 三、AI Logo 生成的优势与特点(一)高效快速AI Logo 生成工具能够在极短的时间内(最短不到 60 秒)生成一批 Logo 方案。 五、AI Logo 版权问题剖析(一)版权政策差异免费 AI Logo 生成工具在版权政策方面存在显著差异。

    57510编辑于 2025-07-15
  • 来自专栏机器之心

    Meta生成AI连放大招:视频生成超越Gen-2,动图表情包随心定制

    机器之心报道 编辑:张倩、陈萍 生成AI 进入视频时代了。 提到视频生成,很多人首先想到的可能是 Gen-2、Pika Labs。 虽然这些模型可以通过使用视频 - 文本对进一步适用于文本 - 视频(T2V)生成,但视频生成在质量和多样性方面仍然落后于图像生成。 ;(2) 根据图像和文本的强化条件生成视频。 AI 模型不同,Emu Edit 可以精确遵循指令,确保输入图像中与指令无关的像素保持不变。 短短几个月的时间,Meta 在图像、视频领域又推出 Emu Video 和 Emu Edit ,我们只能说,生成AI 领域真的太卷了。 了解更多内容,请查看原论文。

    51810编辑于 2023-11-18
  • 来自专栏资讯分享

    AI生成与版权保护

    因此,当原告在诉讼中试图新增证据,表明自身在涉案AI绘画生成过程中存在创作贡献和干预时[2],主审法官Howell予以拒绝并表示,这与法庭查明的涉案作品的前期注册事实不符。 需要注意的是,对于AI生成内容的版权保护,绝不等于对AI版权法上主体地位的认可。另一方面,不对AI生成内容加以保护会带来负面影响。 AI生成内容和非AI生成内容,本质上只是创作工具的不同,生成内容的外在表现形式并无本质差异,最终还是会落入到既有版权客体类型范畴之内。 从版权法角度来看,虽然不强调AI生成创作的“独创性高低”,当仍需满足“独创性有无”。思考二:认定AI生成内容具体构成何类作品,需要看AI生成内容的外观表现形式,符合版权法对于哪些特定作品的要求。 Copyrights and Director of the United States Copyright Office, etal, Civil Action No. 22-1564 (BAH).[2]

    1.3K30编辑于 2023-09-14
  • ai生成PPT网站有哪些?10大AI 生成 PPT 网站大盘点

    下面,我们就来详细介绍一些主流的 AI 生成 PPT 网站,帮助大家找到适合自己的工具。 1、AiPPTAiPPT 是国内较早专注于 AI 生成 PPT 的平台之一,凭借其简洁易用的操作界面和强大的智能生成能力,赢得了众多用户的青睐。 2、CanvaCanva 可画作为知名的在线设计平台,虽然并非专门的 AI 生成 PPT 网站,但凭借其强大的 AI 辅助功能,在 PPT 制作领域占据了重要地位。 Prezi AI 的核心功能是 “智能动态路径生成”:用户输入 PPT 的主题、核心内容模块以及各模块之间的逻辑关系后,AI 会自动生成动态演示路径,确定页面之间的跳转顺序和缩放效果,让演示过程更流畅、 总结以上介绍的 10 款 AI 生成 PPT 网站(含 AI 辅助 PPT 功能的平台),涵盖了不同的功能特色、适用场景和操作风格,从专门的 AI 生成 PPT 工具(如 AiPPT)到集成 AI 功能的综合设计平台

    2.7K11编辑于 2025-09-02
  • 来自专栏运维开发王义杰

    AI: DeepSeek-Coder-V2 中国代码生成领域的重大突破

    DeepSeek-Coder-V2 是由 DeepSeek AI 发布的最新代码生成模型,它在 DeepSeek-Coder-V1 的基础上进行了重大改进,在性能和功能方面都取得了显著提升。 根据 DeepSeek AI 的官方说法,DeepSeek-Coder-V2 的性能与 GPT4-Turbo 相当,这意味着它已经达到了目前代码生成领域的最先进水平。 代码生成: DeepSeek-Coder-V2 可以根据自然语言描述生成代码,这可以帮助开发人员更快地编写代码。 DeepSeek-Coder-V2 的发布标志着代码生成领域的一项重大突破。 以下是一些关于 DeepSeek-Coder-V2 的额外资源: DeepSeek-Coder-V2 官方网站:https://huggingface.co/LoneStriker/DeepSeek-Coder-V2 DeepSeek-Coder-V2 GitHub 仓库:https://github.com/deepseek-ai/DeepSeek-Coder-V2 DeepSeek-Coder-V2 社区论坛:

    3.5K20编辑于 2024-06-25
  • 来自专栏图形学与OpenGL

    实验2 柱状图生成

    一.实验目的: 学习与掌握柱状图生成方法 二.实验内容: 阅读《鲜活的数据》第4章4.2.1节内容,掌握柱状图的生成方法; 根据国家统计局网站上的房地产价格数据(http://data.stats.gov.cn cn=C01)生成一份有关房地产价格的柱状图; 根据柱状图与房地产数据简单写一份房地产价格变化的总结说明。 三. 参考资料: 《鲜活的数据》下载链接: 1. 51CTO: http://down.51cto.com/data/1176619(需要注册才能下载,不过免费); 2. CSDN: http://download.csdn.net/download/zhuxu1234/7437473(需要积分2分);

    90950发布于 2018-10-09
领券