首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏bunny的专栏

    【玩转Lighthouse】轻松搭建视频配音工具晓晓配音

    今天我们将给大家介绍如何使用Lighthouse轻量服务器搭建一个属于自己的在线视频配音工具,可以将文案制作为mp3文件并且生成对应的字幕视频,以便大家在制作视频的过程中方便地为自己的视频添加自然逼真的配音 推荐同学们买一台作为学习使用,用来部署晓晓配音完全绰绰有余 image.png 购买完成后我们可以在控制台重置其系统为Ubunut+Docker专版,由于此系统自带了Docker环境,我们上手就能立刻开始部署 我们需要在防火墙放行对应的端口,推荐一次性开一个范围的端口,这样我们在部署服务的时候就可以不用每次都到控制台编辑规则了 20220414190405.png 登录我们的轻量服务器,然后在任意目录克隆晓晓配音的源代码 ,因此晓晓配音的链接有效期并不长,生成的mp4和mp3文件都是定时过期的 mkdir /tts_storage 然后,我们可以使用-v 参数将此目录作为缓存挂载到容器内部,同时使用-e 传递可用的端口号给容器服务使用 然后使用docker logs查看容器服务是否正常开启 docker logs ms_tts 当看到服务顺利监听到8019端口后,部署就完成了 run.png 最后我们就可以通过ip端口的方式访问晓晓配音服务了

    1.9K100编辑于 2022-04-14
  • 来自专栏音视频技术

    奇声(IQDubbing)-- 面向影视剧的AI配音技术

    爱奇艺在自有的海量内容优势下,基于Voice Conversion,MDX,Denoise等AI技术,研发了面向影视剧场景的AI配音技术IQDubbing,有效地缓解了影视剧配音本地化的问题。 LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践 简单自我介绍下,我是李海,目前主要负责爱奇艺在成都的算法团队,负责影视剧AI配音技术方面的研究和工作。 要想将AI技术真正的落地到影视剧配音当中,在解决人声问题的同时还要解决影片中其他声音的部分。 那么,配音究竟是在做什么?是怎样的一个流程? 在爱奇艺AI配音场景下有很多海外剧集,海外剧包含英语、印度语、俄语等其他各国语言,翻译则是双向的,在爱奇艺剧集出海时需要把中文翻译成对应国家语言;第三步,配音本制作。

    3.1K20编辑于 2023-04-04
  • 来自专栏全栈开发日记

    自动批量真人配音软件

    功能见名思意,可以将文本转为AI智能语音,支持阿里云和腾讯两种接口,简单实用。可批量执行,将需要转的文字放到txt文档中即可,转三千字大概需要一分钟左右,受电脑配置影响。 工具名称:自动批量配音软件 运行系统:Windows 工具大小:6.5MB 工具截图: 使用方法: 需要设置阿里参数或腾讯参数,点击相应参数后的【获取】,可自动跳转到相应的获取页面(免费)。

    1.9K20编辑于 2022-05-13
  • 从轻量试听到API生产:2026常见AI配音方案整理

    一开始原本只是想解决“批量生成配音”的问题,但真正做下来后发现,影响最终效果的其实不仅是模型本身,还包括:文案断句停顿控制voice_type选择长文本切分字幕时间轴音频拼接尤其中文场景,对“节奏感”会非常敏感 这篇主要记录一下最近测试几种AI配音方案时的一些实现过程,以及不同阶段适合的技术路线。一、项目背景:为什么没有直接上API最开始的方案其实很简单:文本→TTSAPI→返回MP3。 目前测试下来,像:叮叮配音配朵朵媒小三配音剪映AI配音这类封装型工具,在前期验证阶段会明显提高效率。尤其在处理:男声旁白多角色对话悬疑解说科普类视频时,直接试听会比反复调API参数更直观。 后来拆分后发现:中文AI配音里,“断句”比情绪参数影响更大。比如:text_list=["很多人以为鲸鱼不会交流。","但实际上,它们拥有复杂的声音系统。"]这种短句分段后,听感会明显比长句自然。

    3510编辑于 2026-05-09
  • 来自专栏量子位

    这个AI能自动给视频配音,真假难辨(不服来试)

    视频内容 你将看到两段画面相同的视频,请判断哪段来自视频原声,哪段是AI根据视频画面配上的假声? 莫非两个都是真的?不可能,答案文末揭晓。 (还有更多真假难辨的视频原声和配音大对比) 真假难辨,简直让人怀疑耳朵。模型合成的假音效,什么时候都这么逼真了?一切还得从这个自动为自然环境下的视频配音的项目说起。 ? 视听关联 看闪电,知雷声。 在这种方法中,研究人员将图像表示(蓝色的FC6立方体)与最粗层的节点联系起来。 研究人员将视频帧表示为xi=V(fi),其中fi为第i帧,V(.)是提取VGG19网络中FC6特征的操作,它已经在ImageNet上进行过预训练,xi是一个4096维向量。 每个场景的配音均为一真一假,当场揭晓答案,猜猜你能对几个——

    3K50发布于 2018-04-02
  • 来自专栏CoderJia的工作笔记

    KrillinAI:基于AI大模型的一站式视频翻译配音解决方案

    项目概述 KrillinAI是一款基于AI大模型技术的全流程视频翻译和配音工具,旨在为内容创作者提供从视频下载到最终成品的一站式解决方案。 系统提供了多种配音选项,默认集成了CosyVoice的语音合成技术,用户还可以上传自己的语音样本进行声音克隆,实现个性化的配音效果。 6. 智能视频合成与格式转换 KrillinAI的视频处理能力不仅限于字幕和配音,还包括视频格式的智能转换。系统能够自动处理横屏和竖屏视频的转换,优化不同平台的显示效果。 系统支持多种AI服务提供商的配置,包括: OpenAI:用于转录和大语言模型服务 本地模型:faster-whisper用于本地语音识别 阿里云:提供语音服务、大模型服务和OSS云存储支持 安装和使用教程 AI驱动的智能处理:利用大语言模型进行字幕分段和翻译,质量远超传统基于规则的方法。 开源可定制:作为开源项目,用户可以根据自己的需求进行修改和扩展。

    1.8K10编辑于 2025-04-16
  • 来自专栏机器之心

    MIT、IBM联合打造AI配音师:检测动作自动添加音效,视频「无声」胜「有声」

    对于 6 秒钟的视频片段,通常包含大约 500 个 MIDI 事件。这些 MIDI 事件可以很容易地导入到标准合成器中生成音乐波形。 ? 图 2:整体架构。

    1.1K20发布于 2020-08-28
  • 来自专栏新智元

    德国小哥用AI拍大片!GPT-2写台词、StyleGAN做特效、Replica来配音

    ---- 新智元报道 来源:towardsdatascience 编辑:白峰、永上 【新智元导读】最近,国外一个技术极客Alex看了电影《阳光泉水》后深受启发,决定自己用AI来生成一部。 Vlad Alex知道了这些后,激动不已,觉得自己也能让AI来拍一部电影,结果真的成功了。 如何制作自己的AI电影呢? 作为 Amazon AWS ai / ml 服务的一部分,Polly 提供各种语言的大量语音,但是Polly产生的语音更像主持人,并不总是适合虚构的内容。 EmptyRoom为我们展示了机器学习在生成视频方面的巨大潜力,不仅简化了流程,还分享了许多创造性的结果,当灵感枯竭的时候也许AI能带给你一股清泉,一起拥抱人工智能吧! 参考链接: https://towardsdatascience.com/ai-as-a-movie-maker-e5865b99a06c

    1.9K30发布于 2020-06-05
  • 短剧出海翻译中的音画同步难题:AI 配音时长自适应与口型适配技术方案

    做过短剧出海翻译的团队大概都踩过同一个坑:字幕翻译完了,配音也生成了,合到视频里一看:角色嘴已经闭上了,配音还在继续说。或者反过来,角色还在说话,配音已经结束了,画面里剩下一段尴尬的静默。 如果TTS引擎没有对情感参数做精细控制,生成的配音节奏和原始表演的节奏就会产生额外偏差。 下面这张图展示了一个典型的音画错位场景——原始中文音频和视频画面完美对齐,但翻译成英语后,由于文本膨胀,每个句段的配音时长都发生了变化,导致整条时间轴逐步偏移。图1:翻译后配音的音画时长错位问题模型。 第二条路线是视频侧适配:用AI直接修改视频中角色的嘴部区域,使其匹配目标语言的配音节奏。 四、工程落地:narrator-ai在时长控制上的实现上面讲的算法思路落到实际工程中,需要一套完整的处理管线来串联各个环节。这里以开源项目NarratorAI的翻译模块为例,说明一下具体的实现方式。

    23310编辑于 2026-04-23
  • 来自专栏新智元

    AI配音版Sora视频刷屏!绝美逼真音效打破「无声电影」,或颠覆万亿美元产业

    语音初创公司ElevenLabs放大招,直接用AI给Sora经典视频完成了配音。网友惊呼离AI完全生成电影又近了一步。 就在今天,AI语音克隆初创公司ElevenLabs给经典的Sora演示视频,完成了绝美的配音。 听过之后,让人简直颅内高潮。 在片尾,ElevenLabs表示,以上所有的配音全部由AI生成,没有一点编辑痕迹。 网友惊呼,「这简直离完全由AI生成电影又近了一步」! 堪称突破后的突破! 尽管ElevenLabs没有固定办公地点并且仅有15名员工,但它却在2023年6月以约1亿美元估值成功筹集到了1900万美元的 A 轮融资。 6月13日,Storytel宣布与ElevenLabs达成独家合作,后者将专门为Storytel的核心市场量身定制声音,制作AI叙述的有声读物。

    40910编辑于 2024-02-26
  • 来自专栏AgenticAI

    6AI Agent模式详解

    在本文中,我们将探讨多种构建 AI 智能体结构的模式。这些模式有助于我们扩展功能、保持模块化,并更好地控制执行流程。 为什么使用多智能体模式? 一开始,通常会采用单智能体模型。 适用于按领域或部门划分逻辑的系统 每个监督者管理一组特定任务或智能体 优势: 高度可扩展且结构清晰 各层级具备模块化控制能力 挑战: 实现复杂度较高 层级之间需要明确定义接口 适用场景: 企业级系统、多领域编排任务 6.

    1.2K10编辑于 2025-07-27
  • 来自专栏软件安装

    国产VS海外:12款国产AI视频工具横向对比实测,感觉国产没想的这么差

    核心功能: ① AI自动生成视频 操作流程极其简单:输入文案 → 选择配音音色 → 一键生成视频。系统会自动匹配画面素材、生成字幕、添加配音。 腾讯智音:大厂出品的AI创作工具 腾讯智音是腾讯推出的AI智能创作工具,拥有AI数字人、AI文字配音、文章转视频等多项AIGC能力。 ② 文本配音 输入文本 → 选择音色 → 自动配音,操作简单,很多音色免费使用。 ③ 文章转视频 输入文本 → 设置成片类型、视频比例、背景音乐、朗读音色 → 一键AI创作。 适用场景: 抖音电商、直播带货、商品推广 6. 优点: 每天免费点数 操作简便 稳定性好 缺点: 运镜相对简单 动态变化不如Runway大 适用场景: 日常创作、预算有限的用户 6.

    3.7K10编辑于 2026-03-26
  • 来自专栏软件安装

    10个GitHub热门的配音语音合成语音克隆项目

    这里推荐几个GitHub上热门、好用的配音/语音合成/语音克隆项目,有通用TTS、语音克隆、视频配音、流式/轻量等不同需求的。 ▌1. OpenVoice(⭐ 34k+) 地址:https://github.com/myshell-ai/OpenVoice 功能: 极速克隆:仅需3秒参考音频 多语言:中英日韩法西,无缝切换 MIT协议: Coqui TTS(⭐ 34k+) 地址:https://github.com/coqui-ai/TTS 功能: 超全语言:支持1100+语言 多模型:YourTTS、VITS、Bark等,兼顾质量与速度 ChatTTS(⭐ 35k+) 地址:https://github.com/2noise/ChatTTS 功能: 对话优化:自然度高、语气贴近真人对话 生成快、一次成型,适合短视频、播客、客服 ▌6. VideoLingo(⭐ 2.5k+) 地址:https://github.com/Huanshere/VideoLingo 功能: Netflix级字幕+配音一体化 支持GPT-SoVITS、Azure

    1.2K10编辑于 2026-03-26
  • AI配音新王者!快手AudioGen-Omni:视频喂给它,歌声语音音效秒出,唇形精准到帧!

    作者:Le Wang等 解读:AI生成未来 文章链接:https://arxiv.org/pdf/2508.00733 项目链接:https://ciyou2.github.io/AudioGen-Omni 为确保时序一致性,我们集成了 Synchformer,这是一种基于 Transformer 的视听同步模型,利用嘴唇运动和音素时序等稀疏线索,在无需密集监督的情况下实现精确对齐,适用于视频生成、配音和语音驱动动画等应用

    86810编辑于 2025-08-27
  • 来自专栏open claw 养龙虾专区

    🎬 再也不熬夜剪片!自动生成视频完全指南(新手可复制)

    2026年,AI智能体已经学会了做视频——搜索影片、生成文案、AI配音、自动剪辑、合成视频,全程自动完成。你不需要懂剪辑软件,不需要会配音,甚至不需要找素材。 AI就会自动完成:搜索影片信息→从90+套解说风格模板里匹配风格→生成文案→调用AI配音→自动剪辑画面→匹配BGM→合成视频→给你下载链接。整个过程10-15分钟。 核心能力:AI故事成片:输入文案,自动生成分镜、配音、字幕、画面AI一键成片:一句话生成创意短视频智能字幕:自动识别并对齐原生对话音频AI调色:统一多镜头色温1.2实战教程:用剪映AI做绘本视频下面以“ 输入以下信息:展开代码语言:TXTAI代码解释主题:勇敢的小种子描述词:改编一个关于种子成长、克服困难的绘本故事,适合3-6岁儿童,语言简单温暖,情节有起伏,结尾传递“勇气与坚持”的主题,故事长度约500 一套完整的自动化Pipeline包含:视频理解:AI自动分析原始素材内容文案生成:AI根据分析结果撰写解说文案配音剪辑:AI自动配音并完成剪辑整个流程可以通过一行命令或一段自然语言指令打通。

    61100编辑于 2026-04-21
  • 来自专栏量子位

    AI六小时开发出游戏Demo,剧本绘画配音一条龙,网友:新概念3“A”大作

    Pine 梦晨 发自 凹非寺 量子位 | 公众号 QbitAI AI又来“抢人类饭碗”了,这次轮到游戏开发者。(手动狗头) 你敢信这是6个小时就能做出来的效果? 这款文字冒险游戏Demo《未来地狱绘图》,由拔丝柠檬制作组开发,游戏里的剧本、立绘、场景、配音甚至是BGM都由AI包揽。 有网友戏称,AI剧本、AI绘画、AI配音,这是新概念“3A大作”。 其中绘图和配音部分由AI根据虚拟主播弥希Miki的形象和声音合成,总共花了三天时间。 △BV1xD4y1k7hK 另外一位up主@莫格露 仅用两个小时就做出一款交互游戏,游戏中的绘图和配音部分也是由AI负责。 v=MjkQv6xszII — 完 —

    85520编辑于 2022-12-08
  • 来自专栏新智元

    文生音频新贵融资5亿,半年估值涨10倍,2年跑出一个AI独角兽!

    AI初创公司里又跑出了一个独角兽! 最近,成立刚满两年的AI音频公司ElevenLabs宣布,他们获得了8000万美元的B轮融资,估值超过10亿美元! 而去年6月份,他们的A轮融资,估值还只有1亿美元,半年多一点的时间估值暴增10倍! Voices可以让用户用AI建立一个自己专有的声音,或者是复制自己的声音,再生成新的内容。 Dubbing可以直接给现成的视频进行AI配音和翻译。 我们先来看看音频的生成。 打造一个独角兽只用两年 ElevenLabs创始人Staniszewski说,他和在波兰长大的Dabkowski从小看了很多配音很差的美国电影,这启发了他们用AI来做一个配音工具,后来就成为了现在的ElevenLabs 配音工作室工作流程使用户能够配音整个电影,以及生成和编辑其转录本、翻译和时间码,从而提供对内容制作的额外控制。这些功能补充了现有的 AI 配音功能,可实现跨29种语言的自动化端到端视频翻译。

    36910编辑于 2024-02-26
  • 来自专栏云瓣

    基于RN开发的一款视频配音APP(开源)

    在如今React、ng、vue三分天下的格局下,不得不让自己加快学习的脚步。虽然经常会陷入各种迷茫,学得越多会发现不会的东西也被无限放大,不过能用新的技术作出一些小项目小Demo还是会给自己些许自信与

    1.2K80发布于 2018-05-02
  • 来自专栏月色的自留地

    从锅炉工到AI专家(6)

    欠拟合和过拟合 几乎所有的复杂方程都存在结果跟预期差异的情况,越复杂的方程,这种情况就越严重。这里面通常都是算法造成的,当然也存在数据集的个体差异问题。 所以”欠拟合“和”过拟合“是机器学习过程中重

    67680发布于 2018-06-20
  • 来自专栏圣杰的专栏

    .NET+AI | MEAI | 会话缓存(6

    MEAI 缓存机制:让 AI 应用响应提速 10 倍 一句话简介 通过 Microsoft.Extensions.AI 的缓存功能,智能存储和复用 AI 响应,显著降低 API 成本并将响应速度提升 10 安装依赖包 dotnet add package Microsoft.Extensions.AI dotnet add package Microsoft.Extensions.AI.OpenAI dotnet 启用缓存(3 行代码) using Microsoft.Extensions.AI; using Microsoft.Extensions.Caching.Distributed; // 创建缓存存储 验证缓存效果 var question = "什么是 Microsoft.Extensions.AI?" Server 等企业级存储 适用场景: FAQ 和客服系统 文档查询和知识库 批量处理和数据分析 下一步: 探索 MEAI 的 Chat Reducer(消息压缩)和自定义中间件功能,构建更强大的 AI

    21010编辑于 2025-12-28
领券