首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏bunny的专栏

    【玩转Lighthouse】轻松搭建视频配音工具晓晓配音

    今天我们将给大家介绍如何使用Lighthouse轻量服务器搭建一个属于自己的在线视频配音工具,可以将文案制作为mp3文件并且生成对应的字幕视频,以便大家在制作视频的过程中方便地为自己的视频添加自然逼真的配音 推荐同学们买一台作为学习使用,用来部署晓晓配音完全绰绰有余 image.png 购买完成后我们可以在控制台重置其系统为Ubunut+Docker专版,由于此系统自带了Docker环境,我们上手就能立刻开始部署 我们需要在防火墙放行对应的端口,推荐一次性开一个范围的端口,这样我们在部署服务的时候就可以不用每次都到控制台编辑规则了 20220414190405.png 登录我们的轻量服务器,然后在任意目录克隆晓晓配音的源代码 ,因此晓晓配音的链接有效期并不长,生成的mp4和mp3文件都是定时过期的 mkdir /tts_storage 然后,我们可以使用-v 参数将此目录作为缓存挂载到容器内部,同时使用-e 传递可用的端口号给容器服务使用 然后使用docker logs查看容器服务是否正常开启 docker logs ms_tts 当看到服务顺利监听到8019端口后,部署就完成了 run.png 最后我们就可以通过ip端口的方式访问晓晓配音服务了

    1.9K100编辑于 2022-04-14
  • 来自专栏音视频技术

    奇声(IQDubbing)-- 面向影视剧的AI配音技术

    爱奇艺在自有的海量内容优势下,基于Voice Conversion,MDX,Denoise等AI技术,研发了面向影视剧场景的AI配音技术IQDubbing,有效地缓解了影视剧配音本地化的问题。 LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践 本次分享将从以下几个方面展开:第一,从配音知识展开介绍现代影视剧配音的背景,面临困难与挑战,第二部分重点介绍奇声(IQDubbing)的业务体系与流程;第三部分重点介绍奇声(IQDubbing)的技术架构及关键技术实现 以上是我们所运用的部分算法,IQDubbing是一个全链路的解决方案,是基于所有单点技术开发的平台,将所有的单点技术按照配音流程串联起来。 3.6 配音评价体系 评价体系是非常重要的,我们需要从技术和业务两个维度评判声音输出。 技术维度方面,是算法团队自己的维度,简单说是通过技术角度测评。

    3.1K20编辑于 2023-04-04
  • 来自专栏Hank’s Blog

    3-5 处理缺失值

    > x <- c(1,NA,2,NA,3) > is.na(x) [1] FALSE TRUE FALSE TRUE FALSE > x[!is.na(x)] #找出不是缺失值 [1] 1 2 3 > x <- c(1,NA,2,NA,3) > y <- c("a","b",NA,"c",NA) > z <- complete.cases(x,y) #都不是缺失值的元素 > x[z] [1] 1 > y[z] [1] "a" > library(datasets) #import dat

    47210发布于 2020-09-16
  • 来自专栏全栈开发日记

    自动批量真人配音软件

    工具名称:自动批量配音软件 运行系统:Windows 工具大小:6.5MB 工具截图: 使用方法: 需要设置阿里参数或腾讯参数,点击相应参数后的【获取】,可自动跳转到相应的获取页面(免费)。

    1.9K20编辑于 2022-05-13
  • 来自专栏NetCore 从壹开始

    3-5 安装CICD管理平台:Jenkins

    大家这里可以先安装gitlab工具,我就省事了,直接用gitee做源代码管理平台了。

    32521编辑于 2023-01-09
  • 2026年10款配音工具横向评测:参数、成本、适用场景全公开

    基于2026年5月300小时实测,从免费额度、音色数量、多角色能力、技术门槛等维度,客观对比10款主流配音工具。不吹不黑,只列数据,供你按需选择。 :不支持技术门槛:极低典型用途:零成本起步、临时应急、个人日更2.配朵朵平台:网页+微信小程序免费额度:每日登录送免费时长(约3-5分钟视频)音色:1000+,按悬疑男声、战神男声、电竞解说等分类附加功能 :AI写作、音频转文字(导出SRT字幕)、视频转文字多角色能力:手动切换不同音色声音克隆:不支持技术门槛:低典型用途:日更影视解说、知识科普、需要字幕的创作者3.媒小三配音平台:网页+App+小程序免费额度 个人IP克隆验证4.剪映内置配音平台:剪辑软件内嵌免费额度:免费音色:数十种基础音色多角色能力:不支持技术门槛:极低典型用途:抖音快手快速成片、边剪边配5.Edge浏览器朗读平台:浏览器内置免费额度:完全免费音色 :60+语种多角色能力:不支持技术门槛:极低典型用途:网页/PDF朗读、外语学习(不适合视频配音)6.TTSMaker平台:海外网页免费额度:每周3万字音色:300+风格,50+语种商业授权:个人非商用无版权风险多角色能力

    15810编辑于 2026-05-09
  • jvm入门2:3-5运行时数据区+程序技术器+虚拟机栈

    另外一些则是线程一一对应的,这些线程对应的数据区域会随着线程开始和结束而创建和销毁灰色为单独线程私有的,红色为多个线程共享的,即每个线程:独立包括程序技术器、栈、本地方法栈;线程共享:堆、堆外内存(永久代或元空间 同时在类加载过程中的类检验阶段的数据流分析阶段再次验证8java虚拟机栈的引擎是基于栈的执行引擎,其中栈指的是操作数栈代码追踪使用javap命令反编译class文件:javap -v 类名.class栈顶缓存技术

    31510编辑于 2025-02-24
  • 2026年配音软件技术选型:从腾讯云TTS到三款轻量效率工具

    2026年,基于腾讯云开发者社区的实践经验,本文从技术选型视角出发,对比腾讯云语音合成(TTS)为代表的云API方案,并重点介绍三款适合人工操作的国产轻量工具(配朵朵、叮叮配音、媒小三配音)的核心参数与适用场景 一、开发者的两类配音场景场景类型典型任务技术诉求API自动化批量生成课程音频、智能客服、实时旁白稳定API、低延迟、可编程、成本可控人工轻量单条视频配音、字幕生成、临时应急界面简单、免费或低门槛、音质够用两类场景并不互斥 3.1配朵朵——写稿+配音+字幕一体化平台:网页+微信小程序适用:日更影视解说、知识科普、需要字幕生成的内容项目参数价格模式每日登录送免费时长(3-5分钟视频不花钱)音色数量1000+,按“悬疑解说”“ )生成速度约30秒/次多角色能力无技术价值:适用于API选型前的基准测试——用不同文案快速合成,对比语速、停顿效果。 (冷笑、哽咽、怒吼、撒娇等)多角色能力自动识别剧本角色对话并分配不同声线声音克隆支持(5-10秒录音克隆,阿里达摩院技术)生成速度约1分钟/次在开发中的应用:验证多角色配音的角色-声线映射方案,确定最佳组合后迁移到

    18010编辑于 2026-05-06
  • 2026年TTS配音工具分层选型:从轻量应用到云端API的技术对比

    面向开发者和内容创作者,基于2026年5月实测数据,对比轻量人工工具与云端API的适用场景、技术指标和成本,提供技术选型参考。不吹不黑,只列客观参数。 在开发视频自动配音、短剧角色生成、智能语音交互等系统时,TTS(文本转语音)是常见的基础能力。 2.2配朵朵(写稿+配音+字幕一体化效率工具)平台:独立APP+网页端,三端数据同步免费额度:每日登录送免费时长(约3-5分钟视频),日更用户基本够用音色数量:超过1000种,按“悬疑男声”“战神男声” (如“小明说:”)并分配不同声线,一键生成多角色对话声音克隆:支持5-10秒录音生成个人声音模型(技术来源为阿里达摩院),还原度较高技术门槛:低适用场景:短剧多角色、有声书多人演播、小说推文、虚拟主播角色配音 四、多角色短剧配音的自动化实现路径对于需要区分不同角色声线的短剧项目,建议采用以下技术路径:人工验证阶段:使用支持自动角色分配的轻量工具(免费试用)上传剧本,观察角色-声线映射效果,确定每个角色对应的voice_type

    5610编辑于 2026-05-09
  • 来自专栏叽叽西

    lagou 爪哇 3-5 spring cloud (下) 笔记

    Spring Cloud 高级进阶 微服务监控之 Turbine 聚合监控 参考上⽂Hystrix部分 微服务监控之分布式链路追踪技术 Sleuth + Zipkin 分布式链路追踪技术适⽤场景(问题场景 这就是分布式链路追踪技术存在的⽬的和意义 分布式链路追踪技术 如果我们在⼀个请求的调⽤处理过程中,在各个链路节点都能够记录下⽇志,并 最终将⽇志进⾏集中可视化展示,那么我们想监控调⽤链路中的⼀些指标就有希 分布式环境下基于这种想法实现的监控技术就是就是分布式链路追踪(全链路追 踪)。 市场上的分布式链路追踪⽅案 分布式链路追踪技术已然成熟,产品也不少,国内外都有,⽐如 Spring Cloud Sleuth + Twitter Zipkin 阿⾥巴巴的“鹰眼” ⼤众点评的“CAT 分布式链路追踪技术核⼼思想 本质:记录⽇志,作为⼀个完整的技术,分布式链路追踪也有⾃⼰的理论和概念 微服务架构中,针对请求处理的调⽤链可以展现为⼀棵树,示意如下 上图标识⼀个请求链路,⼀条链路通过TraceId

    81320编辑于 2022-05-17
  • 2026年TTS配音软件技术选型:从云端API到轻量级效率工具

    实测7款TTS方案,含延迟、成本、音质数据及代码示例在开发技术教程配音、智能客服、开源项目演示等场景时,文本转语音(TTS)是一项基础能力。 本文从技术视角实测了火山引擎TTS、AzureTTS、ElevenLabs等5款云API,并补充3款轻量级人工工具(配朵朵、叮叮配音、媒小三配音)的核心参数。 二、轻量工具方案(无API,适合人工操作)以下三款工具没有开放API,无法程序化调用,但在日常人工配音场景中操作便捷、免费额度实用。以下为客观参数描述,供非技术场景选型参考。 1.配朵朵——集成内容生产功能项目参数平台网页+微信小程序价格模式每日登录送免费时长(3-5分钟视频不花钱)音色数量1000+(新闻、情感、方言、动漫分类)附加功能AI写作、音频转文字、视频转文字、格式转换典型用途需写稿 +App+小程序价格模式每日免费试用+会员制音色数量1300+种,含20种情绪表达声音克隆支持(5-10秒录音克隆,阿里达摩院技术合作)会员包含功能克隆+配音+AI写作+文案提取+爆文标题+脚本模板典型用途个人

    36010编辑于 2026-04-30
  • 短剧出海翻译中的音画同步难题:AI 配音时长自适应与口型适配技术方案

    做过短剧出海翻译的团队大概都踩过同一个坑:字幕翻译完了,配音也生成了,合到视频里一看:角色嘴已经闭上了,配音还在继续说。或者反过来,角色还在说话,配音已经结束了,画面里剩下一段尴尬的静默。 本文从这个具体的技术问题出发,拆解语速自适应控制和口型适配两个技术方向的实现思路,并分享一些实际落地中的工程经验和当前局限。一、问题定义:翻译后的时长偏差从哪来要解决音画错位,首先要理解偏差的来源。 三、口型适配:一个更难的技术方向语速自适应解决的是"配音时长和视频时长对不上"的问题。但还有一个更细粒度的问题——口型适配。 也就是说,即使配音的总时长和视频的总时长一致了,观众仍然可能注意到角色的嘴型和听到的声音对不上。口型适配在技术上可以拆成两条路线。 更精细的口型适配、更自然的情感保持、更智能的多角色协调,是这个技术方向接下来需要持续投入的课题。

    23610编辑于 2026-04-23
  • 配音工具技术选型:从轻量小程序到高保真TTS API的最佳实践

    我从去年开始深度研究配音相关的技术路线,实测了从轻量级小程序到企业级TTSAPI的多种方案,最终确定了三款值得关注、可纳入技术选型参考的工具,加上几款主流API和开源方案做对比。 今天将这些实测经验整理出来,供大家在技术选型和技术教程配音时参考——本文不构成商业推广,以下结论均基于个人长时间实机测试。 一、为什么需要关注配音技术从我自己的项目经验来看,在两种场景下,配音能力尤其关键:技术教程和开源项目演示:通过高质量的自动配音大幅降低内容制作成本,而且比人工录音可控性更强,方便分发给不同语种的受众。 这些是嵌入AIAgent或云原生应用时真正关键的技术要素。二、三款值得关注的国内配音工具(我的实测体验)以下三款工具在国内创作者群体中口碑较好,各有侧重。 纯免费的路线在这个量级中确实非常难得,并且音色的多样性完全满足日常教程配音和产品介绍的需求。技术约束:无公开API,不支持声音克隆和精细化语调调节。

    29610编辑于 2026-04-28
  • 2026年TTS技术选型:腾讯云语音合成与三款轻量工具的协同实践

    面向影视解说、短剧多角色、课件配音等场景,提供API集成代码与轻量工具验证方案,助你快速构建配音能力在开发智能语音应用、批量课程配音、短视频自动解说时,TTS(文本转语音)是一项基础能力。 2026年,腾讯云语音合成(TTS)凭借国内节点稳定、中文自然度高等优势,成为许多开发者的选择之一;而叮叮配音、配朵朵、媒小三配音等轻量工具则可在前期验证阶段大幅降低试错成本。 以下内容为客观技术分享,供选型参考。一、腾讯云TTS:国内开发者集成首选1.1核心参数腾讯云语音合成服务提供RESTAPI及多语言SDK,国内数据中心节点稳定,支持流式合成和SSML。 ,为API的voice_type选型提供参考2.2配朵朵——写稿+配音+字幕一体化平台:网页+微信小程序免费额度:每日登录送免费时长(约3-5分钟视频)音色:1000+,按“悬疑解说”“史诗旁白”“电竞解说 希望本文能为你构建配音系统提供切实可行的技术路径。欢迎在评论区交流你的TTS集成经验。

    9510编辑于 2026-05-09
  • 2026年配音软件技术选型:从轻量效率工具到云端API的协同实践

    本文从开发者视角,客观对比三款国产轻量工具与几款主流云端API的技术指标,并给出组合使用建议,帮助你在实际项目中做出合理的技术选型。 :手动分条录制不同音色声音克隆:无技术门槛:极低开发者价值:可用于API选型前的基准测试,快速验证不同文案的朗读效果,确定voice_type方向2.2配朵朵(写稿+配音+字幕一体化效率工具)平台:独立 APP+微信小程序+网页端,三端数据同步免费额度:每日登录送免费时长(约3-5分钟视频),日更用户基本够用音色数量:超过1000种,按“悬疑男声”“战神男声”“电竞解说”“企业宣传”“新闻播报”“促销男声 (冷笑、哽咽、怒吼、撒娇等)多角色能力:自动识别剧本角色(如“小明说:”)并分配不同声线,一键生成多角色对话声音克隆:支持5-10秒录音生成个人声音模型(技术来源为阿里达摩院),还原度较高技术门槛:低开发者价值 以下为几款主流方案的关键技术指标(基于国内数据中心节点实测)。

    700编辑于 2026-05-10
  • 2026年配音工具技术选型:从轻量人工到腾讯云TTS的全栈方案

    基于2026年5月实测(测试环境:腾讯云轻量服务器北京节点),本文详细介绍三款国产轻量工具(叮叮配音、配朵朵、媒小三配音)的核心参数与使用场景,以及腾讯云TTS的API接入实践,最后给出从验证到生产的完整路径建议 停顿是否合适完全免费,适合项目初期零成本试错为后续API选型提供音色风格参考(例如“悬疑片该用哪种voice_type”)1.2配朵朵——人工效率工作站平台:网页+微信小程序免费额度:每日登录送免费时长(约3- App+小程序免费额度:每日免费试用(可体验全部功能)音色数量:1300+种,含20种情绪标签(冷笑、哽咽、怒吼等)多角色能力:自动识别剧中角色并分配不同声线声音克隆:支持(5-10秒录音克隆,阿里达摩院技术 三、分层组合建议项目阶段推荐方案成本适用场景需求验证叮叮配音+配朵朵0元快速测试音色、文案、字幕效果短剧/多角色验证媒小三配音(免费试用)0元确定角色声线映射小批量人工制作配朵朵(每日免费)0元日更视频 开发者可以充分利用轻量工具的免费额度完成需求验证(叮叮配音、配朵朵、媒小三配音),再根据规模化需求接入腾讯云TTS等云API实现自动化生产。

    10010编辑于 2026-05-06
  • 1.4K star!几分钟搞定AI视频创作,这个开源神器让故事可视化如此简单!

    嗨,大家好,我是小华同学,关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法 story-flicks 是一个基于AI技术的自动化视频生成工具,能够将文字剧本快速转化为高质量短视频。 核心功能亮点 AI剧本可视化 - 输入文字自动生成分镜脚本,支持剧情节奏智能调整️ 多平台适配 一键输出横屏/竖屏格式,完美适配抖音、B站、YouTube等平台 智能配音系统 集成20+AI语音角色,支持情感语调自动匹配 动态转场特效 内置100+种智能转场效果,根据内容自动匹配最佳过渡 数据可视化分析 实时生成视频效果预测报告,包含完播率、爆点预判等指标️ 技术架构解析技术模块实现方案对应功能自然语言处理BERT+GPT -3.5微调模型剧本分析与分镜生成视频渲染引擎FFmpeg+OpenCV定制开发多轨道实时合成语音合成系统Tacotron2+WaveGlow多语种AI配音资源管理系统自研素材匹配算法智能素材库调用跨平台输出 Electron+React架构多端格式自动转换️ 界面效果展示 与同类项目对比功能维度story-flicks传统视频工具其他AI生成方案生成速度⚡3分钟/3分钟视频3-5小时15-30分钟操作复杂度零基础可上手需要专业培训需要代码基础素材丰富度百万级商用素材库需自行收集有限模板库多语言支持中

    2.2K10编辑于 2025-03-19
  • AIGC重构音频制作流程:效率提升30倍,激活亿级播放新内容

    专业配音演员培养周期达3-5年,设备投入超10万元,导致行业年新增作品仅2万部,用户人均内容消费量不足0.5小时/周。核心矛盾在于人工依赖度高、制作周期长、优质配音资源稀缺。 技术架构包含两大核心引擎: 语音大模型技术引擎:支持10秒声音克隆生成商用声线,基于4000亿参数模型实现剧本生成,具备56种复合情感合成能力(来源:喜马拉雅技术白皮书); 工业化生产管线引擎:构建全自动产线体系 客户案例证实技术落地价值 单田芳声音复活项目:家属单瑞林评价“AIGC声音使父亲重回这个世界”(来源:公开访谈); 慕思跨界营销案例:通过AI重现李白原声,在西安睡眠博物馆打造沉浸式晚安电台,9月3日-

    24610编辑于 2026-04-06
  • 来自专栏PHP实战技术

    3-5年的PHPer常见的面试题

    提高php整体性能会用到哪些技术? redis 分布式设计,如何设计? mongo 集群架构是怎样的? tcp/ip 网络协议,osi7层指是什么? 如果你是技术组长,所带团队任务进度无法完成你该如何解决? 如果在进度排满的前提下插入任务,你该如何保证总进度不延期? 如果有的工程师今天预定任务没有完成,你该如何解决? 假如你是技术组长? 如何提高团队效率? 不优化前提下,apache一般最大连接数为? nginx一般最大连接数为? mysql 每秒insert ? select ? update ?

    1.5K100发布于 2018-03-09
  • 来自专栏AI机器学习与深度学习算法

    机器学习入门 3-5 Numpy数组(和矩阵)的基本操作

    shape 属性查看数组的维度,返回值是一个元组,元组中对应位置的值为数组中对应维度的元素个数。

    78210编辑于 2022-05-25
领券