首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏bunny的专栏

    【玩转Lighthouse】轻松搭建视频配音工具晓晓配音

    今天我们将给大家介绍如何使用Lighthouse轻量服务器搭建一个属于自己的在线视频配音工具,可以将文案制作为mp3文件并且生成对应的字幕视频,以便大家在制作视频的过程中方便地为自己的视频添加自然逼真的配音 推荐同学们买一台作为学习使用,用来部署晓晓配音完全绰绰有余 image.png 购买完成后我们可以在控制台重置其系统为Ubunut+Docker专版,由于此系统自带了Docker环境,我们上手就能立刻开始部署 我们需要在防火墙放行对应的端口,推荐一次性开一个范围的端口,这样我们在部署服务的时候就可以不用每次都到控制台编辑规则了 20220414190405.png 登录我们的轻量服务器,然后在任意目录克隆晓晓配音的源代码 ,因此晓晓配音的链接有效期并不长,生成的mp4和mp3文件都是定时过期的 mkdir /tts_storage 然后,我们可以使用-v 参数将此目录作为缓存挂载到容器内部,同时使用-e 传递可用的端口号给容器服务使用 然后使用docker logs查看容器服务是否正常开启 docker logs ms_tts 当看到服务顺利监听到8019端口后,部署就完成了 run.png 最后我们就可以通过ip端口的方式访问晓晓配音服务了

    1.9K100编辑于 2022-04-14
  • 来自专栏软件安装

    10个GitHub热门的配音语音合成语音克隆项目

    这里推荐几个GitHub上热门、好用的配音/语音合成/语音克隆项目,有通用TTS、语音克隆、视频配音、流式/轻量等不同需求的。 ▌1. YouDub(⭐ 1.2k+) 地址:https://github.com/liuzhao1225/YouDub 功能: 自动:YouTube视频 → 语音识别 → 翻译 → 克隆原UP主音色 → 中文配音 VideoLingo(⭐ 2.5k+) 地址:https://github.com/Huanshere/VideoLingo 功能: Netflix级字幕+配音一体化 支持GPT-SoVITS、Azure Fish Speech(⭐ 10k+) 地址:https://github.com/fishaudio/fish-speech 功能: 基于VITS2,高质量、多语言、语音克隆 推理快、支持批量处理、全开源 ▌10.

    1.2K10编辑于 2026-03-26
  • 来自专栏音视频技术

    奇声(IQDubbing)-- 面向影视剧的AI配音技术

    爱奇艺在自有的海量内容优势下,基于Voice Conversion,MDX,Denoise等AI技术,研发了面向影视剧场景的AI配音技术IQDubbing,有效地缓解了影视剧配音本地化的问题。 LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践 3.4.2 第二代框架 基于第一代基础上加入韵律模型,提高表现力,运用VQ-Wav2Vec训练模型,另外替换原有ASR,使用E2E的方式,时间分辨率从30ms提升到10ms。 3.6 配音评价体系 评价体系是非常重要的,我们需要从技术和业务两个维度评判声音输出。 技术维度方面,是算法团队自己的维度,简单说是通过技术角度测评。 累计3篇语音类顶级国际会议论文,包括ISCSLP、InterSpeech,有10多个国家发明专利,获得5个软件著作权,多家主流媒体的报道,近期获得中国多媒体企业创新产品奖,受到业界蛮多的关注。

    3.1K20编辑于 2023-04-04
  • 来自专栏全栈开发日记

    自动批量真人配音软件

    工具名称:自动批量配音软件 运行系统:Windows 工具大小:6.5MB 工具截图: 使用方法: 需要设置阿里参数或腾讯参数,点击相应参数后的【获取】,可自动跳转到相应的获取页面(免费)。

    1.9K20编辑于 2022-05-13
  • 2026年10配音工具横向评测:参数、成本、适用场景全公开

    基于2026年5月300小时实测,从免费额度、音色数量、多角色能力、技术门槛等维度,客观对比10款主流配音工具。不吹不黑,只列数据,供你按需选择。 做视频、做课件、做有声内容,选对配音工具能省下不少时间。下面把10款工具的核心参数和适用场景列出来,不含主观推荐,只作参考。 :1万字符/月定价(超出):约2.1元/千字技术指标:音质高,支持情感标签,国内需代理多角色能力:部分支持技术门槛:中(需代理)典型用途:预算充足的有声书、高情感要求影视项目10.OpenAITTS平台 万字)可关注:火山引擎TTS、AzureTTS、ElevenLabs(高成本)、OpenAITTS(海外)注意事项:需编程,按量付费三、成本参考(月生成10万中文字)叮叮配音:0元配朵朵(免费层):0元媒小三配音 是:可先试用媒小三配音免费验证效果预估月产量?10万字以内:轻量工具免费额度通常足够10万字以上:建议云API按量计费,国内项目优先试用国内云服务是否涉及多语言跨境电商?

    11810编辑于 2026-05-09
  • 2026年TTS配音工具分层选型:从轻量应用到云端API的技术对比

    在开发视频自动配音、短剧角色生成、智能语音交互等系统时,TTS(文本转语音)是常见的基础能力。 (如“小明说:”)并分配不同声线,一键生成多角色对话声音克隆:支持5-10秒录音生成个人声音模型(技术来源为阿里达摩院),还原度较高技术门槛:低适用场景:短剧多角色、有声书多人演播、小说推文、虚拟主播角色配音 三、云端API方案:主流服务技术指标对比当项目需要批量生成(月产超过10万字)或实时交互时,建议评估云端TTSAPI。以下为几款主流方案的关键技术指标(基于国内数据中心节点实测)。 四、多角色短剧配音的自动化实现路径对于需要区分不同角色声线的短剧项目,建议采用以下技术路径:人工验证阶段:使用支持自动角色分配的轻量工具(免费试用)上传剧本,观察角色-声线映射效果,确定每个角色对应的voice_type 中小规模生产(月产<10万字)继续使用轻量工具免费额度,无需切换。规模化生产(月产>10万字)接入云端API(优先选择国内节点稳定、定价透明的方案),编写批量脚本。

    3910编辑于 2026-05-09
  • 2026年TTS配音软件技术选型:从云端API到轻量级效率工具

    实测7款TTS方案,含延迟、成本、音质数据及代码示例在开发技术教程配音、智能客服、开源项目演示等场景时,文本转语音(TTS)是一项基础能力。 本文从技术视角实测了火山引擎TTS、AzureTTS、ElevenLabs等5款云API,并补充3款轻量级人工工具(配朵朵、叮叮配音、媒小三配音)的核心参数。 二、轻量工具方案(无API,适合人工操作)以下三款工具没有开放API,无法程序化调用,但在日常人工配音场景中操作便捷、免费额度实用。以下为客观参数描述,供非技术场景选型参考。 +App+小程序价格模式每日免费试用+会员制音色数量1300+种,含20种情绪表达声音克隆支持(5-10秒录音克隆,阿里达摩院技术合作)会员包含功能克隆+配音+AI写作+文案提取+爆文标题+脚本模板典型用途个人 ,不限量人工声音克隆媒小三配音10秒克隆,会员全包数据私有+有GPULongCat-AudioDiT开源自部署五、成本参考(月生成10万中文字)工具月成本估算备注叮叮配音0元人工操作,完全免费配朵朵0元每日免费额度覆盖媒小三配音

    35710编辑于 2026-04-30
  • 短剧出海翻译中的音画同步难题:AI 配音时长自适应与口型适配技术方案

    中文翻译成英文,文本平均膨胀30%—50%;翻译成日语或韩语,文本反而会压缩10%—20%。这种时长偏差一旦累积到整集短剧的尺度上,音画错位就会从"轻微不适"演变成"完全不可用"。 本文从这个具体的技术问题出发,拆解语速自适应控制和口型适配两个技术方向的实现思路,并分享一些实际落地中的工程经验和当前局限。一、问题定义:翻译后的时长偏差从哪来要解决音画错位,首先要理解偏差的来源。 三、口型适配:一个更难的技术方向语速自适应解决的是"配音时长和视频时长对不上"的问题。但还有一个更细粒度的问题——口型适配。 也就是说,即使配音的总时长和视频的总时长一致了,观众仍然可能注意到角色的嘴型和听到的声音对不上。口型适配在技术上可以拆成两条路线。 更精细的口型适配、更自然的情感保持、更智能的多角色协调,是这个技术方向接下来需要持续投入的课题。

    23510编辑于 2026-04-23
  • 配音工具技术选型:从轻量小程序到高保真TTS API的最佳实践

    我从去年开始深度研究配音相关的技术路线,实测了从轻量级小程序到企业级TTSAPI的多种方案,最终确定了三款值得关注、可纳入技术选型参考的工具,加上几款主流API和开源方案做对比。 今天将这些实测经验整理出来,供大家在技术选型和技术教程配音时参考——本文不构成商业推广,以下结论均基于个人长时间实机测试。 一、为什么需要关注配音技术从我自己的项目经验来看,在两种场景下,配音能力尤其关键:技术教程和开源项目演示:通过高质量的自动配音大幅降低内容制作成本,而且比人工录音可控性更强,方便分发给不同语种的受众。 生成速度快(10-15秒),微信小程序即开即用。我个人的实测感受:有次出差,笔记本电脑上没有任何配音软件,突然要补一条教程演示视频,打开叮叮配音小程序,十几秒就拿到了音频。 ③媒小三配音:声音克隆与多重内容创作集成平台平台:网页+App+小程序核心功能:声音克隆:5-10秒录音即可高还原复刻专属声音模型,打造个人IP辨识度。

    29210编辑于 2026-04-28
  • 2026年配音工具技术选型:从轻量人工到腾讯云TTS的全栈方案

    短剧多角色与声音克隆验证器平台:网页+App+小程序免费额度:每日免费试用(可体验全部功能)音色数量:1300+种,含20种情绪标签(冷笑、哽咽、怒吼等)多角色能力:自动识别剧中角色并分配不同声线声音克隆:支持(5-10 秒录音克隆,阿里达摩院技术)生成速度:约1分钟/次开发者价值:验证短剧剧本的角色-声线映射方案,确定每个角色最适合的voice_type克隆结果可作为API自定义声线的参考基准免费试用,零成本完成多角色配音的可行性验证二 、云API层:腾讯云TTS集成实践当项目进入规模化生产阶段(月产超过10万中文字或需要实时交互),推荐使用腾讯云语音合成服务。 2.1核心参数指标实测数据首包延迟300–400ms(流式合成)中文自然度9/10(神经拟人模型)定价新用户试用,按量计费低至1.2元/千字SSML支持实时场景WebSocket流式合成SDKPython 四、成本参考(月产10万中文字)方案月成本备注叮叮配音0元完全免费配朵朵(免费层)0元每日免费时长覆盖媒小三配音(试用)0元免费试用含全部功能腾讯云TTS约120元按量计费AzureTTS(免费层内)0

    10010编辑于 2026-05-06
  • 2026年配音软件技术选型:从腾讯云TTS到三款轻量效率工具

    2026年,基于腾讯云开发者社区的实践经验,本文从技术选型视角出发,对比腾讯云语音合成(TTS)为代表的云API方案,并重点介绍三款适合人工操作的国产轻量工具(配朵朵、叮叮配音、媒小三配音)的核心参数与适用场景 一、开发者的两类配音场景场景类型典型任务技术诉求API自动化批量生成课程音频、智能客服、实时旁白稳定API、低延迟、可编程、成本可控人工轻量单条视频配音、字幕生成、临时应急界面简单、免费或低门槛、音质够用两类场景并不互斥 )生成速度约30秒/次多角色能力无技术价值:适用于API选型前的基准测试——用不同文案快速合成,对比语速、停顿效果。 (冷笑、哽咽、怒吼、撒娇等)多角色能力自动识别剧本角色对话并分配不同声线声音克隆支持(5-10秒录音克隆,阿里达摩院技术)生成速度约1分钟/次在开发中的应用:验证多角色配音的角色-声线映射方案,确定最佳组合后迁移到 五、成本参考(月生成10万中文字)方案月成本备注叮叮配音0元完全免费配朵朵(免费层)0元每日免费时长覆盖媒小三配音(试用)0元免费试用含全部功能腾讯云TTS约120-150元具体以官网定价为准AzureTTS

    18010编辑于 2026-05-06
  • 来自专栏LiveEdu在线科技教育平台

    2017编程趋势预测:10技术大热,10技术遇冷

    不同的是,由于编程重视的是高效,用户化和使用方便,因此编程技术需要不断更新换代。那么,在即将到来的2017年和未来的几年内,会有哪些新技术出现,成为新的潮流,又有哪些技术的热潮会渐渐消退呢? 下面所列出的10技术,摘自infoworld.com的一位编辑Peter Wayner撰写的文章21 hot programming trends -- and 21 going cold。 10. 在线即时教育成趋势,四年传统教育不再是主流 以计算机为媒介的课程已经不是新玩意了,每个人正在享受着观看视频讲座的好处。 但这不仅是教育的一种本质,网上课程技术的背后是它颠覆了教育产业技术的复杂性;它还可以让你灵活地支配自己的学习时间和地点。 在编程世界,无论是哪一种潮流的兴起或衰退,都是编程技术的魅力所在。它总是在快速变化,又总是充满着激情和争论。这也正是编程世界精彩的地方。

    1.8K100发布于 2018-05-21
  • 来自专栏达达前端

    前端技术前沿10

    允许用户从NPM服务器下载别人编写的第三方包到本地使用。 允许用户从NPM服务器下载并安装别人编写的命令行程序到本地使用。 允许用户将自己编写的包或命令行程序上传到NPM服务器供别人使用。

    1.9K30发布于 2019-07-03
  • 技术博主配音工具选型:从腾讯云TTS到开源方案,2026年5款工具横评

    在制作技术教程、开源项目演示或产品介绍视频时,配音是不可或缺的环节。个人录音耗时且效果不稳定,而AI语音合成(TTS)技术已相当成熟。 音色库接近千种,覆盖普通话、方言、解说、情感音等,日常技术讲解足够。内置视频转文字、AI写作等附加功能。小程序即开即用,生成速度快(10-15秒)。 核心能力:声音克隆基于阿里达摩院音频克隆技术,5-10秒本人录音即可生成高还原度专属声线。“捏声音”功能:自定义声线参数(性别、年龄、音调、气质)。 FishAudio有是零样本(10-30秒)试用后付费开源免费/0.003元/千字符高保真、私有化有声书、数据隐私项目配朵朵无否无每日免费免费额度日常够用一站式内容生产人工创作流程叮叮配音无否无完全免费 0元轻量个人使用新手、应急媒小三配音无否高精度(5-10秒)每日免费会员制声音克隆与IP个人IP、品牌声线开发者选型建议需要企业级多语言TTS、与腾讯云生态集成:腾讯云TTS提供多语种支持(40+语种)

    93120编辑于 2026-04-21
  • 来自专栏媒矿工厂

    视频技术10大进展@2020

    媒矿工厂盘点了本年度视频技术的一些代表性技术,总结成以下10个方面。 1.新一代视频编码标准正式公布 ? 英伟达率先发力,Facebook紧跟其后,核心技术在于GAN人脸生成技术的进展,将其应用在视频会议特定领域,也是顺利成章。 /21/networking-traffic/how-facebook-is-bringing-quic-to-billions/ 【10】https://blog.chromium.org/2020/ 10/chrome-is-deploying-http3-and-ietf-quic.html 5.视频流媒体核心技术ABR算法研究平台及新Benchmark ? 此外,ITU-T今年也推出了新一代流媒体无参考视频质量评估模型P.1204,适用于H.264、H.265和VP9编码的UHD/4K、60fps、10bit视频序列,该模型可以部署在分发系统中的任何位置,

    1.7K40发布于 2021-01-11
  • 来自专栏小小程序员——DATA

    JavaWeb day10会话技术

    ,该技术在实际开发中也非常重要。 那么接下来我们就需要去学习下会话跟踪技术,在学习这些技术之前,我们需要思考:为什么现在浏览器和服务器不支持数据共享呢? 具体的实现方式有: (1)客户端会话跟踪技术:Cookie (2)服务端会话跟踪技术:Session 这两个技术都可以实现会话跟踪,它们之间最大的区别:Cookie是存储在浏览器端而Session是存储在服务器端 (3)Tomcat服务器发现业务处理中使用了session对象,就会把session的唯一标识id:10当做一个cookie,添加Set-Cookie:JESSIONID=10到响应头中,并响应给浏览器 Tomcat (6)demo2获取到请求后,从请求头中就读取cookie中的JSESSIONID值为10,然后就会到服务器内存中寻找id:10的session对象,如果找到了,就直接返回该对象,如果没有则新创建一个

    48840编辑于 2023-03-07
  • 来自专栏小小程序员——DATA

    JavaWeb day10会话技术

    ,该技术在实际开发中也非常重要。 那么接下来我们就需要去学习下会话跟踪技术,在学习这些技术之前,我们需要思考:为什么现在浏览器和服务器不支持数据共享呢? 具体的实现方式有: (1)客户端会话跟踪技术:==Cookie== (2)服务端会话跟踪技术:==Session== 这两个技术都可以实现会话跟踪,它们之间最大的区别:==Cookie是存储在浏览器端而 服务器响应结果给浏览器 (3)Tomcat服务器发现业务处理中使用了session对象,就会把session的唯一标识id:10当做一个cookie,添加Set-Cookie:JESSIONID=10到响应头中 的格式添加到请求头中并发送给服务器Tomcat (6)demo2获取到请求后,从请求头中就读取cookie中的JSESSIONID值为10,然后就会到服务器内存中寻找id:10的session对象,如果找到了

    91500编辑于 2023-03-02
  • 来自专栏Golang语言社区

    随谈10年的技术生涯和技术成长

    先简单分享自己这10年在技术上曾经感觉到明显迷茫的阶段: 阶段1:只会增删改查: 时间:大学期间(2005年-2006年) 学习的方式:看视频、看书。(学会了使用控件的增删改查,和写SQL语句)。 听说.NET界的架构师很少,其实是.NET的技术总监或CTO太少,毕竟是上层决定了下层的技术使用。 因此,从现实出发,混到总监的,有些也不在乎技术了,也没有技术情节和忠诚感,转个技术方向突破薪资才是硬道理。 生态圈的良性循环,还是得靠占据总监位置的同志们,坚持。。。 目前.NET大多数都在1W左右2W以下的薪资,勉强占领高级程序员或技术经理这么个角色。 追期根源,是因为技术上没有亮点,技术还停留在能做功能的地步,技术和思想也没形成体系。 怎么成长才能突破? 然后说说技术,感觉技术成长不上去的时候,怎么办? 先说说现在年轻人最大的感觉,很多人在用我的开源框架,但是他们遇到问题时,很多都是直接上问题,不愿调试代码。

    783160发布于 2018-03-23
  • 来自专栏FreeBuf

    技术讨论 | Windows 10进程镂空技术(木马免杀)

    前言 在Win10 x64环境下替换正常的进程,是一个比较高超的技术。使用该技术,可以内存执行病毒、木马。在文件层面实现免杀。可以把一个木马使用DES加密,放在资源里。 Win10平台测试 将ProcessReplacement.exe拖入虚拟机。 ? 双击,提示 ? 看样子是缺少什么文件? 总结 本文介绍的Win10 x64进程镂空技术,可以在文件层面实现木马免杀。 *本文作者:河马安全网,转载请注明来自FreeBuf.COM

    2.4K10发布于 2018-07-30
  • 来自专栏云瓣

    基于RN开发的一款视频配音APP(开源)

    虽然经常会陷入各种迷茫,学得越多会发现不会的东西也被无限放大,不过能用新的技术作出一些小项目小Demo还是会给自己些许自信与接着学习的动力。 项目部分展现 项目源码地址 ? ? ? 项目简介 1.

    1.2K80发布于 2018-05-02
领券