首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏bunny的专栏

    【玩转Lighthouse】轻松搭建视频配音工具晓晓配音

    今天我们将给大家介绍如何使用Lighthouse轻量服务器搭建一个属于自己的在线视频配音工具,可以将文案制作为mp3文件并且生成对应的字幕视频,以便大家在制作视频的过程中方便地为自己的视频添加自然逼真的配音 推荐同学们买一台作为学习使用,用来部署晓晓配音完全绰绰有余 image.png 购买完成后我们可以在控制台重置其系统为Ubunut+Docker专版,由于此系统自带了Docker环境,我们上手就能立刻开始部署 我们需要在防火墙放行对应的端口,推荐一次性开一个范围的端口,这样我们在部署服务的时候就可以不用每次都到控制台编辑规则了 20220414190405.png 登录我们的轻量服务器,然后在任意目录克隆晓晓配音的源代码 ,因此晓晓配音的链接有效期并不长,生成的mp4和mp3文件都是定时过期的 mkdir /tts_storage 然后,我们可以使用-v 参数将此目录作为缓存挂载到容器内部,同时使用-e 传递可用的端口号给容器服务使用 然后使用docker logs查看容器服务是否正常开启 docker logs ms_tts 当看到服务顺利监听到8019端口后,部署就完成了 run.png 最后我们就可以通过ip端口的方式访问晓晓配音服务了

    1.9K100编辑于 2022-04-14
  • 来自专栏音视频技术

    奇声(IQDubbing)-- 面向影视剧的AI配音技术

    爱奇艺在自有的海量内容优势下,基于Voice Conversion,MDX,Denoise等AI技术,研发了面向影视剧场景的AI配音技术IQDubbing,有效地缓解了影视剧配音本地化的问题。 LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践 本次分享将从以下几个方面展开:第一,从配音知识展开介绍现代影视剧配音的背景,面临困难与挑战,第二部分重点介绍奇声(IQDubbing)的业务体系与流程;第三部分重点介绍奇声(IQDubbing)的技术架构及关键技术实现 以上是我们所运用的部分算法,IQDubbing是一个全链路的解决方案,是基于所有单点技术开发的平台,将所有的单点技术按照配音流程串联起来。 3.6 配音评价体系 评价体系是非常重要的,我们需要从技术和业务两个维度评判声音输出。 技术维度方面,是算法团队自己的维度,简单说是通过技术角度测评。

    3.1K20编辑于 2023-04-04
  • 来自专栏全栈开发日记

    自动批量真人配音软件

    工具名称:自动批量配音软件 运行系统:Windows 工具大小:6.5MB 工具截图: 使用方法: 需要设置阿里参数或腾讯参数,点击相应参数后的【获取】,可自动跳转到相应的获取页面(免费)。

    1.9K20编辑于 2022-05-13
  • 2026年TTS配音工具分层选型:从轻量应用到云端API的技术对比

    面向开发者和内容创作者,基于2026年5月实测数据,对比轻量人工工具与云端API的适用场景、技术指标和成本,提供技术选型参考。不吹不黑,只列客观参数。 在开发视频自动配音、短剧角色生成、智能语音交互等系统时,TTS(文本转语音)是常见的基础能力。 (如“小明说:”)并分配不同声线,一键生成多角色对话声音克隆:支持5-10秒录音生成个人声音模型(技术来源为阿里达摩院),还原度较高技术门槛:低适用场景:短剧多角色、有声书多人演播、小说推文、虚拟主播角色配音 三、云端API方案:主流服务技术指标对比当项目需要批量生成(月产超过10万字)或实时交互时,建议评估云端TTSAPI。以下为几款主流方案的关键技术指标(基于国内数据中心节点实测)。 四、多角色短剧配音的自动化实现路径对于需要区分不同角色声线的短剧项目,建议采用以下技术路径:人工验证阶段:使用支持自动角色分配的轻量工具(免费试用)上传剧本,观察角色-声线映射效果,确定每个角色对应的voice_type

    3900编辑于 2026-05-09
  • 2026年TTS配音软件技术选型:从云端API到轻量级效率工具

    实测7款TTS方案,含延迟、成本、音质数据及代码示例在开发技术教程配音、智能客服、开源项目演示等场景时,文本转语音(TTS)是一项基础能力。 本文从技术视角实测了火山引擎TTS、AzureTTS、ElevenLabs等5款云API,并补充3款轻量级人工工具(配朵朵、叮叮配音、媒小三配音)的核心参数。 其神经拟人模型对技术术语的重音处理准确,适合教程类内容。 二、轻量工具方案(无API,适合人工操作)以下三款工具没有开放API,无法程序化调用,但在日常人工配音场景中操作便捷、免费额度实用。以下为客观参数描述,供非技术场景选型参考。 +App+小程序价格模式每日免费试用+会员制音色数量1300+种,含20种情绪表达声音克隆支持(5-10秒录音克隆,阿里达摩院技术合作)会员包含功能克隆+配音+AI写作+文案提取+爆文标题+脚本模板典型用途个人

    35610编辑于 2026-04-30
  • 短剧出海翻译中的音画同步难题:AI 配音时长自适应与口型适配技术方案

    做过短剧出海翻译的团队大概都踩过同一个坑:字幕翻译完了,配音也生成了,合到视频里一看:角色嘴已经闭上了,配音还在继续说。或者反过来,角色还在说话,配音已经结束了,画面里剩下一段尴尬的静默。 本文从这个具体的技术问题出发,拆解语速自适应控制和口型适配两个技术方向的实现思路,并分享一些实际落地中的工程经验和当前局限。一、问题定义:翻译后的时长偏差从哪来要解决音画错位,首先要理解偏差的来源。 三、口型适配:一个更难的技术方向语速自适应解决的是"配音时长和视频时长对不上"的问题。但还有一个更细粒度的问题——口型适配。 也就是说,即使配音的总时长和视频的总时长一致了,观众仍然可能注意到角色的嘴型和听到的声音对不上。口型适配在技术上可以拆成两条路线。 更精细的口型适配、更自然的情感保持、更智能的多角色协调,是这个技术方向接下来需要持续投入的课题。

    23410编辑于 2026-04-23
  • 配音工具技术选型:从轻量小程序到高保真TTS API的最佳实践

    我从去年开始深度研究配音相关的技术路线,实测了从轻量级小程序到企业级TTSAPI的多种方案,最终确定了三款值得关注、可纳入技术选型参考的工具,加上几款主流API和开源方案做对比。 今天将这些实测经验整理出来,供大家在技术选型和技术教程配音时参考——本文不构成商业推广,以下结论均基于个人长时间实机测试。 一、为什么需要关注配音技术从我自己的项目经验来看,在两种场景下,配音能力尤其关键:技术教程和开源项目演示:通过高质量的自动配音大幅降低内容制作成本,而且比人工录音可控性更强,方便分发给不同语种的受众。 这些是嵌入AIAgent或云原生应用时真正关键的技术要素。二、三款值得关注的国内配音工具(我的实测体验)以下三款工具在国内创作者群体中口碑较好,各有侧重。 纯免费的路线在这个量级中确实非常难得,并且音色的多样性完全满足日常教程配音和产品介绍的需求。技术约束:无公开API,不支持声音克隆和精细化语调调节。

    29110编辑于 2026-04-28
  • 来自专栏云计算linux

    ES6技术

    ES6技术 一.ES6基础和语法 1.JavaScript和ECMAScript的关联 JavaScript之前是LiveScript,具体的资料,大家自己查一下百度。 ECMA第39号技术委员会 (TC39): 负责制定和审核ECMA-262标准,成员由业内的大公司派出的工程师组成,目前共25个人。该委员会定期开会,所有的邮件讨论和会议记录,都是公开的。 ES6泛指ES6之后的版本,再往后,ESNEXT。 padStart(数字>=字符串长度,补全的字符) console.log(str.padEnd(5).length); 7.2 模板字符串 反引号 嵌入变量写法 运算操作 调用函数 用途 ES6增加一个新的技术 接下来,看看ES6是如何写的呢? 6.2 ES6类的定义: <!

    46210编辑于 2024-12-19
  • 2026年配音工具技术选型:从轻量人工到腾讯云TTS的全栈方案

    基于2026年5月实测(测试环境:腾讯云轻量服务器北京节点),本文详细介绍三款国产轻量工具(叮叮配音、配朵朵、媒小三配音)的核心参数与使用场景,以及腾讯云TTS的API接入实践,最后给出从验证到生产的完整路径建议 App+小程序免费额度:每日免费试用(可体验全部功能)音色数量:1300+种,含20种情绪标签(冷笑、哽咽、怒吼等)多角色能力:自动识别剧中角色并分配不同声线声音克隆:支持(5-10秒录音克隆,阿里达摩院技术 三、分层组合建议项目阶段推荐方案成本适用场景需求验证叮叮配音+配朵朵0元快速测试音色、文案、字幕效果短剧/多角色验证媒小三配音(免费试用)0元确定角色声线映射小批量人工制作配朵朵(每日免费)0元日更视频 四、成本参考(月产10万中文字)方案月成本备注叮叮配音0元完全免费配朵朵(免费层)0元每日免费时长覆盖媒小三配音(试用)0元免费试用含全部功能腾讯云TTS约120元按量计费AzureTTS(免费层内)0 开发者可以充分利用轻量工具的免费额度完成需求验证(叮叮配音、配朵朵、媒小三配音),再根据规模化需求接入腾讯云TTS等云API实现自动化生产。

    10010编辑于 2026-05-06
  • 来自专栏十二惊惶的网络安全研究记录

    IPv6过渡技术

    IPv6过渡技术 # 理解使用隧道机制实现IPv6穿越IPv4的原理 # 掌握6to4自动隧道、ISATAP自动隧道的实现机制 # 掌握Win 7下配置6to4路由器、ISATAP路由器的方法 [TOC ,以避免过多的浪费 过渡时期采用技术的选择 双栈技术(Dual Stack) 让IPv4和IPv6共存于同一设备和网络中(RFC 2893),采用该技术的节点上同时运行IPv4和IPv6两套协议栈 对IPv4 双栈技术的特点 双栈技术是一切过渡技术的基础,隧道机制和翻译机制都要利用双栈节点 双栈技术应该能独立的配置IPv4和IPv6地址 双栈技术的优点是互通性好,易于理解;缺点是需要给每个新的运行IPv6 其中前缀可以是链路本地地址前缀、站点本地前缀和全球前缀(包括6to4前缀) 协议转换技术 NAT技术 NAT有三种类型:静态NAT;动态NAT;网络地址端口转换NAPT 对于IPv4向IPv6过渡机制来讲 ;IPv6网络之间的互通 lPv6过渡时期建议采用的过渡原则: 能直接建立IPv6链路的情况下,使用纯IPv6路由 不能使用IPv6链路的情况下,IPv6节点间使用隧道技术 双栈的IPv4/IPv6

    87210编辑于 2024-02-28
  • 2026年配音软件技术选型:从腾讯云TTS到三款轻量效率工具

    2026年,基于腾讯云开发者社区的实践经验,本文从技术选型视角出发,对比腾讯云语音合成(TTS)为代表的云API方案,并重点介绍三款适合人工操作的国产轻量工具(配朵朵、叮叮配音、媒小三配音)的核心参数与适用场景 一、开发者的两类配音场景场景类型典型任务技术诉求API自动化批量生成课程音频、智能客服、实时旁白稳定API、低延迟、可编程、成本可控人工轻量单条视频配音、字幕生成、临时应急界面简单、免费或低门槛、音质够用两类场景并不互斥 电影预告”“史诗旁白”“电竞解说”分类附加功能AI写作、音频转文字(导出SRT字幕)、视频转文字、格式转换生成速度约1分钟/次多角色能力手动切换不同音色(分条录制)技术特点无需编程,每日免费额度足够日更在开发流程中的价值 )生成速度约30秒/次多角色能力无技术价值:适用于API选型前的基准测试——用不同文案快速合成,对比语速、停顿效果。 (冷笑、哽咽、怒吼、撒娇等)多角色能力自动识别剧本角色对话并分配不同声线声音克隆支持(5-10秒录音克隆,阿里达摩院技术)生成速度约1分钟/次在开发中的应用:验证多角色配音的角色-声线映射方案,确定最佳组合后迁移到

    18010编辑于 2026-05-06
  • 来自专栏云计算linux

    ES6.Class技术

    第六讲 ES6.Class ​ 编程语言语言,都有关于类的定义和使用,java,C#,C++。使用class的关键字,js之前的版本,没有用。保留字,ES6启用了该关键字。 接下来,看看ES6是如何写的呢? 6.2 ES6类的定义: <! html lang="en"> <head> <meta charset="UTF-8"> <title>Title</title> <script> //使用ES6来定义类 ; console.log(typeof(Person)); //输出的是一个function //证明ES6,class对应了之前的function ,使用class 类名{ ​ //构造方法 //自定义方法 } 2.ES6 静态方法的定义和使用 3.ES6 子类继承父类的语法和使用

    20710编辑于 2024-12-13
  • 来自专栏ccf19881030的博客

    Qt 6技术概览

    Qt 6技术概览 Qt 6技术概览 Qt对用户的价值体现在哪里? 新一代的QML 下一代图形 统一并且一致的工具库 增强已有的C++ API 语言支持 兼容Qt 5和增量改进 市场和技术产品结构 欢迎你的参与和反馈 Qt 6技术概览 本文转载自Qt 6技术概览 新一代的QML QML和Qt Quick是过去几年推动Qt增长的主要技术。使用这些技术可以直观的创建用户界面是我们产品的一个独特卖点。 QML是为Qt 5创建的,但是它有一些问题和限制。 我们将提供一个新的技术预览版本的Qt Quick与3D支持的版本,它已经包含在了Qt 5.14中,更多的信息将会在一个单独的博文中进行说明。 欢迎你的参与和反馈 在Qt 6第一个版本发布前,技术概览将逐步完善。虽然我相信本文档为Qt的下一个版本奠定了基础,但它肯定还有很多需要完善的地方。

    3K10发布于 2020-12-22
  • 来自专栏达达前端

    前端技术前沿6

    最终组合成的对象是 {a: 1, b: 2, c: 3, d: 4, e: 5}。

    73030发布于 2019-07-03
  • 来自专栏program

    Flutter技术与实战(6)

    而对于企业而言,这种方式不仅具备了原生 App 良好的用户体验,以及丰富的底层能力,还同时拥有了跨平台技术开发低成本和多端体验一致性的优势,直接节省研发资源。 可以看到,在混合工程架构中,像原生工程依赖 Flutter 模块、Flutter 模块又依赖原生工程这样跨技术栈的依赖管理行为,我们实际上是通过将双方抽象为彼此对应技术栈的依赖,从而实现分层管理的:即将原生对 前 6 个阶段是 Flutter 的标准工作流,最后一个阶段是原生开发的标准工作流。 对于 Flutter 标准工作流的 6 个阶段而言,每个阶段都会涉及业务或产品特性提出的特异性要求,技术方案的选型,各阶段工作成本可用性、可靠性的衡量,以及监控相关基础服务的接入和配置等。 在原生工程中为 Flutter 模块提供基础能力支撑的过程中,面对跨技术栈的依赖管理,我们该遵循何种原则呢?

    3.4K32编辑于 2022-06-29
  • 来自专栏微信公众号【Java技术江湖】

    后端技术杂谈6:白话虚拟化技术

    https://github.com/h2pl/Java-Tutorial 喜欢的话麻烦点下Star哈 文章将同步到我的个人博客: www.how2playlife.com 该系列博文会介绍常见的后端技术 ,这对后端工程师来说是一种综合能力,我们会逐步了解搜索技术,云计算相关技术、大数据研发等常见的技术喜提,以便让你更完整地了解后端技术栈的全貌,为后续参与分布式应用的开发和学习做好准备。 如果对本系列文章有什么建议,或者是有什么疑问的话,也可以关注公众号【Java技术江湖】联系我,欢迎你参与本系列博文的创作和修订。 内核,是指的操作系统内核。 如果您想更技术的了解本文背后的原理,请看书《系统虚拟化——原理与实现》

    74610发布于 2019-12-09
  • 来自专栏大模型&AIGC

    6种大模型微调技术

    input和target,则使用原始的input embedding(5) 使用方式离散和连续template token混合时,显示地插入一下anchor(离散的token)有助于template的优化(6) 当参数量达10B,效果相当于FT6.LoRA(2021)(1) 论文信息来自论文:《LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS》(2)摘要自然语言处理的一个重要范式包括在通用领域数据上进行大规模预训练 d,k)$(5) 学习目标原始的LLM,一般也是CLM (Causal Language Model/Conditional Language Model),学习目标为而加入LoRA后,学习目标为:(6)

    2.7K00编辑于 2025-05-08
  • 来自专栏TalkPython

    Python技术周刊:第 6

    欢迎来到《Python技术周刊》这是第6期,每周六发布,让我们直接进入本周的内容。由于微信不允许外部链接,你需要点击页尾左下角”阅读原文“,才能访问文中的链接。 6、Python数据可视化指南[6] 介绍通过Python第三方库Seaborn,实现数据可视化。 6、获取IP地址的最酷的方法[18] eyep.dev,是一个工具,可以很方便、而且非常酷的方式获取你的IP地址。 人们借助于完美的灯光效果、专业妆术和图片处理技术,创做出各式各样的广告——就连模特本人最终呈现给人的形象也像换了一个人。这些就是我们所在的现代世界中的超常刺激。 6、盖子法则:锅里的水总是漫不过盖子,领导力就像一个盖子,它决定了一个人的办事效力。

    54030发布于 2019-07-30
  • 来自专栏网络技术联盟站

    IPv6组播技术

    出现于 IPv4时代的组播技术,由于其有效解决了单点发送、多点接收的问题, 实现了网络中点到多点的高效数据传送,能够大量节约网络带宽、降低网络负载,因此在 IPv6 中 的应用得到了进一步的丰富和加强。 IPv6 组播技术实现 IPv6组播地址 在介绍 IPv6组播地址之前,先简单回顾一下 IPv6的地址结构:IPv6地址的长度为 128比特,每个 IPv6地址被分为 8组,每组的 16比特用 4个十六进制数来表示 图1 IPv6组播地址格式 如图 1所示,IPv6组播地址中各字段的含义如下: 0xFF:最高 8比特为 11111111,标识此地址为 IPv6组播地址。 ,IPv6协议无关组播)和 IPv6 MBGP(IPv6 Multicast BGP,IPv6 组播 BGP)等。 ,IPv6协议无关组播—稀 疏模式) IPv6 PIM-SSM(IPv6 Protocol Independent Multicast Source-Specific Multicast,IPv6协议

    5.3K20发布于 2020-07-10
  • 来自专栏SDNLAB

    SRv6技术课堂(一):SRv6概述

    本文系《SRv6技术课堂系列》的第一讲,后续将陆续更新各个维度的SRv6技术细节,欢迎大家批评指正。 从SRv6 SID的组成来看,SRv6同时具有路由和MPLS两种转发属性,可以融合两种转发技术的优点。 IPv4技术发展的一个重要教训是可扩展性问题,设计之初没有想到会有这么多的设备接入IP网络,由此触发了IPv6技术的发展。而IPv6技术发展的一个重要教训是可兼容性问题。 基于MPLS的承载技术用于IP Core承载,再到城域承载、移动承载,替代了帧中继、ATM、TDM等多种网络技术,实现了网络承载技术的统一。 图5 IP技术发展代际 SRv6技术的出现,实际承担了解决这些关键问题的使命: 第一个是SRv6兼容IPv6路由转发,基于IP可达性实现不同网络域间的连接更加容易,无需像MPLS那样必须引入额外信令

    4.8K10发布于 2019-11-29
领券