首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏bunny的专栏

    【玩转Lighthouse】轻松搭建视频配音工具晓晓配音

    今天我们将给大家介绍如何使用Lighthouse轻量服务器搭建一个属于自己的在线视频配音工具,可以将文案制作为mp3文件并且生成对应的字幕视频,以便大家在制作视频的过程中方便地为自己的视频添加自然逼真的配音 ,并且为其它视频创作者提供帮助 LiuChangFreeman/ms-tts-web (github.com) github.png 一、购买一台轻量服务器 腾讯云的学生优惠是相当给力的,2核4G一年只要 推荐同学们买一台作为学习使用,用来部署晓晓配音完全绰绰有余 image.png 购买完成后我们可以在控制台重置其系统为Ubunut+Docker专版,由于此系统自带了Docker环境,我们上手就能立刻开始部署 我们需要在防火墙放行对应的端口,推荐一次性开一个范围的端口,这样我们在部署服务的时候就可以不用每次都到控制台编辑规则了 20220414190405.png 登录我们的轻量服务器,然后在任意目录克隆晓晓配音的源代码 ,因此晓晓配音的链接有效期并不长,生成的mp4和mp3文件都是定时过期的 mkdir /tts_storage 然后,我们可以使用-v 参数将此目录作为缓存挂载到容器内部,同时使用-e 传递可用的端口号给容器服务使用

    1.9K100编辑于 2022-04-14
  • 来自专栏音视频技术

    奇声(IQDubbing)-- 面向影视剧的AI配音技术

    爱奇艺在自有的海量内容优势下,基于Voice Conversion,MDX,Denoise等AI技术,研发了面向影视剧场景的AI配音技术IQDubbing,有效地缓解了影视剧配音本地化的问题。 LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践 以上是我们所运用的部分算法,IQDubbing是一个全链路的解决方案,是基于所有单点技术开发的平台,将所有的单点技术按照配音流程串联起来。 3.6 配音评价体系 评价体系是非常重要的,我们需要从技术和业务两个维度评判声音输出。 技术维度方面,是算法团队自己的维度,简单说是通过技术角度测评。 4、IQDubbing上线效果 4.1 上线效果 目前爱奇艺配音已经在中文主站和海外站(泰国站、越南站等)上线,中文主站包括007系列大战皇家赌场,终结者和007黑日危机等都是当家热剧。

    3.1K20编辑于 2023-04-04
  • 来自专栏全栈开发日记

    自动批量真人配音软件

    工具名称:自动批量配音软件 运行系统:Windows 工具大小:6.5MB 工具截图: 使用方法: 需要设置阿里参数或腾讯参数,点击相应参数后的【获取】,可自动跳转到相应的获取页面(免费)。

    1.9K20编辑于 2022-05-13
  • 来自专栏三太子敖丙

    多模态视频是剪辑配音,击败GPT-4靠「作弊」?

    虽然说从技术原理上来看,能够读取图片和能够看懂视频之间,并没有技术上的鸿沟。 打败GPT-4,靠的是「作弊」 另外,谷歌发布的这个表格,显示出Gemini Ultra在大多数标准基准测试中击败了GPT-4。 可是这种比较并不公平。 HuggingFace技术主管Philipp Schmid特意从Gemini的技术报告中扒了数据,重做了一张新图——如果使用5-shot,Gemini的得分实为83.7%,而非90.0%。 而且,Gemini Ultra对于GPT-4仅有几个百分点的优势,但是GPT-4,是OpenAI差不多一年前的产品。 这似乎是在暗指OpenAI的技术。 我们都知道,ChatGPT的多模态能力,是由GPT-4、DALL·E 3、Whisper多个模型组合而实现的。

    52610编辑于 2023-12-12
  • 2026年TTS配音工具分层选型:从轻量应用到云端API的技术对比

    面向开发者和内容创作者,基于2026年5月实测数据,对比轻量人工工具与云端API的适用场景、技术指标和成本,提供技术选型参考。不吹不黑,只列客观参数。 在开发视频自动配音、短剧角色生成、智能语音交互等系统时,TTS(文本转语音)是常见的基础能力。 (如“小明说:”)并分配不同声线,一键生成多角色对话声音克隆:支持5-10秒录音生成个人声音模型(技术来源为阿里达摩院),还原度较高技术门槛:低适用场景:短剧多角色、有声书多人演播、小说推文、虚拟主播角色配音 三、云端API方案:主流服务技术指标对比当项目需要批量生成(月产超过10万字)或实时交互时,建议评估云端TTSAPI。以下为几款主流方案的关键技术指标(基于国内数据中心节点实测)。 四、多角色短剧配音的自动化实现路径对于需要区分不同角色声线的短剧项目,建议采用以下技术路径:人工验证阶段:使用支持自动角色分配的轻量工具(免费试用)上传剧本,观察角色-声线映射效果,确定每个角色对应的voice_type

    3900编辑于 2026-05-09
  • 2026年TTS配音软件技术选型:从云端API到轻量级效率工具

    实测7款TTS方案,含延迟、成本、音质数据及代码示例在开发技术教程配音、智能客服、开源项目演示等场景时,文本转语音(TTS)是一项基础能力。 本文从技术视角实测了火山引擎TTS、AzureTTS、ElevenLabs等5款云API,并补充3款轻量级人工工具(配朵朵、叮叮配音、媒小三配音)的核心参数。 以下数据基于2026年4月个人实测,测试环境:腾讯云轻量服务器(北京)→各厂商API节点。 二、轻量工具方案(无API,适合人工操作)以下三款工具没有开放API,无法程序化调用,但在日常人工配音场景中操作便捷、免费额度实用。以下为客观参数描述,供非技术场景选型参考。 +App+小程序价格模式每日免费试用+会员制音色数量1300+种,含20种情绪表达声音克隆支持(5-10秒录音克隆,阿里达摩院技术合作)会员包含功能克隆+配音+AI写作+文案提取+爆文标题+脚本模板典型用途个人

    35510编辑于 2026-04-30
  • 短剧出海翻译中的音画同步难题:AI 配音时长自适应与口型适配技术方案

    本文从这个具体的技术问题出发,拆解语速自适应控制和口型适配两个技术方向的实现思路,并分享一些实际落地中的工程经验和当前局限。一、问题定义:翻译后的时长偏差从哪来要解决音画错位,首先要理解偏差的来源。 三、口型适配:一个更难的技术方向语速自适应解决的是"配音时长和视频时长对不上"的问题。但还有一个更细粒度的问题——口型适配。 也就是说,即使配音的总时长和视频的总时长一致了,观众仍然可能注意到角色的嘴型和听到的声音对不上。口型适配在技术上可以拆成两条路线。 rewrite_prompt=f"""请将以下英文句子改写为更简洁的表达,要求:1.保持原始语义不变2.保持原句的情感基调和语气3.改写后的句子长度控制在{target_min}—{target_max}个字符之间4. 更精细的口型适配、更自然的情感保持、更智能的多角色协调,是这个技术方向接下来需要持续投入的课题。

    23310编辑于 2026-04-23
  • 配音工具技术选型:从轻量小程序到高保真TTS API的最佳实践

    我从去年开始深度研究配音相关的技术路线,实测了从轻量级小程序到企业级TTSAPI的多种方案,最终确定了三款值得关注、可纳入技术选型参考的工具,加上几款主流API和开源方案做对比。 今天将这些实测经验整理出来,供大家在技术选型和技术教程配音时参考——本文不构成商业推广,以下结论均基于个人长时间实机测试。 一、为什么需要关注配音技术从我自己的项目经验来看,在两种场景下,配音能力尤其关键:技术教程和开源项目演示:通过高质量的自动配音大幅降低内容制作成本,而且比人工录音可控性更强,方便分发给不同语种的受众。 这些是嵌入AIAgent或云原生应用时真正关键的技术要素。二、三款值得关注的国内配音工具(我的实测体验)以下三款工具在国内创作者群体中口碑较好,各有侧重。 四、开源TTS项目:数据私有着重考虑(2026年更新)除了上述方案,以及VoiceBox、VoxCPM2等轻量工具,今年4月美团还开源了LongCat-AudioDiT——直接在波形潜空间做扩散生成,从根部减少音色失真

    29110编辑于 2026-04-28
  • 2026年配音工具技术选型:从轻量人工到腾讯云TTS的全栈方案

    基于2026年5月实测(测试环境:腾讯云轻量服务器北京节点),本文详细介绍三款国产轻量工具(叮叮配音、配朵朵、媒小三配音)的核心参数与使用场景,以及腾讯云TTS的API接入实践,最后给出从验证到生产的完整路径建议 App+小程序免费额度:每日免费试用(可体验全部功能)音色数量:1300+种,含20种情绪标签(冷笑、哽咽、怒吼等)多角色能力:自动识别剧中角色并分配不同声线声音克隆:支持(5-10秒录音克隆,阿里达摩院技术 三、分层组合建议项目阶段推荐方案成本适用场景需求验证叮叮配音+配朵朵0元快速测试音色、文案、字幕效果短剧/多角色验证媒小三配音(免费试用)0元确定角色声线映射小批量人工制作配朵朵(每日免费)0元日更视频 四、成本参考(月产10万中文字)方案月成本备注叮叮配音0元完全免费配朵朵(免费层)0元每日免费时长覆盖媒小三配音(试用)0元免费试用含全部功能腾讯云TTS约120元按量计费AzureTTS(免费层内)0 开发者可以充分利用轻量工具的免费额度完成需求验证(叮叮配音、配朵朵、媒小三配音),再根据规模化需求接入腾讯云TTS等云API实现自动化生产。

    10010编辑于 2026-05-06
  • 2026年配音软件技术选型:从腾讯云TTS到三款轻量效率工具

    2026年,基于腾讯云开发者社区的实践经验,本文从技术选型视角出发,对比腾讯云语音合成(TTS)为代表的云API方案,并重点介绍三款适合人工操作的国产轻量工具(配朵朵、叮叮配音、媒小三配音)的核心参数与适用场景 一、开发者的两类配音场景场景类型典型任务技术诉求API自动化批量生成课程音频、智能客服、实时旁白稳定API、低延迟、可编程、成本可控人工轻量单条视频配音、字幕生成、临时应急界面简单、免费或低门槛、音质够用两类场景并不互斥 电影预告”“史诗旁白”“电竞解说”分类附加功能AI写作、音频转文字(导出SRT字幕)、视频转文字、格式转换生成速度约1分钟/次多角色能力手动切换不同音色(分条录制)技术特点无需编程,每日免费额度足够日更在开发流程中的价值 )生成速度约30秒/次多角色能力无技术价值:适用于API选型前的基准测试——用不同文案快速合成,对比语速、停顿效果。 (冷笑、哽咽、怒吼、撒娇等)多角色能力自动识别剧本角色对话并分配不同声线声音克隆支持(5-10秒录音克隆,阿里达摩院技术)生成速度约1分钟/次在开发中的应用:验证多角色配音的角色-声线映射方案,确定最佳组合后迁移到

    18010编辑于 2026-05-06
  • 来自专栏达达前端

    前端技术前沿4

    mpvue.com/ 3:组件化开发框架wepy Github地址: https://github.com/Tencent/wepy 官网地址: https://tencent.github.io/wepy 4: weapp.iviewui.com/ 8:ZanUI-WeApp -- 一个颜值高、好用、易扩展的微信小程序 UI 库 https://cnodejs.org/topic/589d625a5c8036f7019e7a4a

    86530发布于 2019-07-03
  • 来自专栏program

    Flutter技术与实战(4)

    作为移动应用交互设计的热点趋势,越来越多的移动应用使用了这项技术。 , radius * 3, radius, true, getColoredPaint(Colors.red)); canvas.drawArc(boundingRect, radius * 4, placeholder.png └──3.0x └── placeholder.png Image.asset('assets/placeholder.png', package: 'package4' ); AssetImage('assets/placeholder.png', package: 'package4'); 举例 在 Flutter 中,提供了表达日期的数据结构DateTime,这个类拥有极大的表示范围 x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3lhbmdfc3R1ZHlfZmlyc3Q

    12.4K20编辑于 2022-06-29
  • 来自专栏零拷贝技术

    4、sendfile(零拷贝技术

    Linux 版本下的 sendfile 演进:Linux 提供 sendfile技术。Kafka中,transferFrom和transferTo方法。 零拷贝技术:先从用户态切换到内核态,把磁盘数据拷贝到内核缓冲区,同时从内环缓冲区拷贝一些offset和length数据到socket缓冲区, 接着从内核态切换到用户态,从内核缓冲区直接把数据拷贝到网络协议引擎里去

    80610编辑于 2024-03-10
  • 技术博主配音工具选型:从腾讯云TTS到开源方案,2026年5款工具横评

    在制作技术教程、开源项目演示或产品介绍视频时,配音是不可或缺的环节。个人录音耗时且效果不稳定,而AI语音合成(TTS)技术已相当成熟。 FishSpeechS2-Pro采用双自回归(Dual-AR)架构,语义生成4B参数,残差码本生成400M参数,单个NVIDIAH200上实时因子低至0.195。 基础配音每日免费,AI写作和视频转文字有免费额度,无弹窗强制收费。跨平台数据同步(网页+小程序),操作流程:粘贴文案→选音色→生成下载。技术限制:无公开API,不适合程序化批量调用。 四、叮叮配音(小程序):纯免费轻量级TTS技术定位:完全免费的轻量级TTS工具,无API,但功能全面。核心能力:完全免费,不限字数、不限时长,无广告弹窗。 五、媒小三配音(网页/APP/小程序):声音克隆与AI写作技术定位:声音克隆+AI写作工具箱,无公开API,提供每日免费额度。

    93020编辑于 2026-04-21
  • 来自专栏软件安装

    10个GitHub热门的配音语音合成语音克隆项目

    这里推荐几个GitHub上热门、好用的配音/语音合成/语音克隆项目,有通用TTS、语音克隆、视频配音、流式/轻量等不同需求的。 ▌1. 地址:https://github.com/CorentinJ/Real-Time-Voice-Cloning 功能: 经典实时语音克隆框架,5秒克隆、实时生成 社区成熟、教程多,适合二次开发 ▌ 4. YouDub(⭐ 1.2k+) 地址:https://github.com/liuzhao1225/YouDub 功能: 自动:YouTube视频 → 语音识别 → 翻译 → 克隆原UP主音色 → 中文配音 VideoLingo(⭐ 2.5k+) 地址:https://github.com/Huanshere/VideoLingo 功能: Netflix级字幕+配音一体化 支持GPT-SoVITS、Azure

    1.2K10编辑于 2026-03-26
  • 来自专栏东风微鸣技术博客

    OpenShift 4 监控技术栈解析

    了解 红帽OpenShift 4监控技术栈 概述 默认平台监控级别 OpenShift 4 包括一个预配置、预安装和自我更新的监控技术栈,用于监控核心平台组件。 监控技术栈 OpenShift 4 监控堆栈基于 Prometheus 开源项目及其更广的生态系统。监控堆栈包括以下组件: 默认平台监控组件。 监控技术栈中的所有组件都由技术栈自监控,并在 OpenShift 更新时自动更新。 : JAVA Python Nodejs Golang NGINX RabbitMQ Redis Kafka 总结 OpenShift 4的监控技术栈, 说实话, 站在用户的角度来看: 1套容器集群而已 , 还用2套共4个prometheus, 再加上Thanos.

    1.5K20编辑于 2022-04-21
  • 来自专栏太阳影的学习记录

    UE4技术总结——委托

    UE4技术总结——委托 在开始前先说明,这部分内容主要基于UE 4.26.2版本[1]编写,因此读者可能需要注意时效性。 同时,UE4中存在由基本委托组合起来的委托,但是在介绍组合的委托之前我们先看看这3种基本委托。 接下来我们先简单看看该怎么用。 顺带一提,这里我默认读者知道如何在C++中实现委托,如果您还不清楚,那么建议阅读文末参考中列出的的文章[4](了解即可)。 说到这里我想应该已经明白了UE4这个改动的含义。 ↩︎ UE4:4.26版本对Delegate模块的改进 ↩︎ C++ 模板,特化,与偏特化 ↩︎ 泛化之美--C++11可变模版参数的妙用 ↩︎ UE4-深入委托Delegate实现原理

    3.7K31发布于 2021-10-15
  • 来自专栏初见Linux

    4.路由器技术

    一、NAT技术(网络地址转换) 1.NAT作用 主要解决IP地址短缺问题,并且避免来自外部的攻击。 主要有 3 种应用方式:动态地址转换、静态地址转换、网络地址端口转换NART。 二、CIDR(无类域间路由)技术 CIDR(无类域间路由) 就是超网 ,将小的或者不足的汇聚成大的网段。 两个技术结合可以解决路由缩放 。 三、MPLS(第三层交换技术) ? MPLS.png 四、IP组播技术(重点) 1.IP组播 一个IP代表一个主机叫做单播地址。 常用IP组播地址.png 4.组播与MAC映射 把组地址的低23位复制到以太网地址中 ? 五、IP QoS技术 ? IPQoS技术.png

    93410发布于 2020-08-05
  • 来自专栏云瓣

    基于RN开发的一款视频配音APP(开源)

    虽然经常会陷入各种迷茫,学得越多会发现不会的东西也被无限放大,不过能用新的技术作出一些小项目小Demo还是会给自己些许自信与接着学习的动力。 项目部分展现 项目源码地址 ? ? ? 项目简介 1.

    1.2K80发布于 2018-05-02
  • 来自专栏VRPinea

    奥斯卡最佳女配角Alicia Vikander,将为VR动画短片配音

    《Arden's Wake》于今年4月18日,在翠贝卡电影节亮相,该短片给观众提供了最新的VR动画体验。

    76160发布于 2018-05-17
领券