首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏bunny的专栏

    【玩转Lighthouse】轻松搭建视频配音工具晓晓配音

    今天我们将给大家介绍如何使用Lighthouse轻量服务器搭建一个属于自己的在线视频配音工具,可以将文案制作为mp3文件并且生成对应的字幕视频,以便大家在制作视频的过程中方便地为自己的视频添加自然逼真的配音 推荐同学们买一台作为学习使用,用来部署晓晓配音完全绰绰有余 image.png 购买完成后我们可以在控制台重置其系统为Ubunut+Docker专版,由于此系统自带了Docker环境,我们上手就能立刻开始部署 我们需要在防火墙放行对应的端口,推荐一次性开一个范围的端口,这样我们在部署服务的时候就可以不用每次都到控制台编辑规则了 20220414190405.png 登录我们的轻量服务器,然后在任意目录克隆晓晓配音的源代码 ,因此晓晓配音的链接有效期并不长,生成的mp4和mp3文件都是定时过期的 mkdir /tts_storage 然后,我们可以使用-v 参数将此目录作为缓存挂载到容器内部,同时使用-e 传递可用的端口号给容器服务使用 然后使用docker logs查看容器服务是否正常开启 docker logs ms_tts 当看到服务顺利监听到8019端口后,部署就完成了 run.png 最后我们就可以通过ip端口的方式访问晓晓配音服务了

    1.9K100编辑于 2022-04-14
  • 来自专栏后端开发从入门到入魔

    7-2 寻找大富翁

    7-2 寻找大富翁 分数 25 全屏浏览题目 切换布局 作者 陈越 单位 浙江大学 胡润研究院的调查显示,截至2017年底,中国个人资产超过1亿元的高净值人群达15万人。

    27810编辑于 2024-03-01
  • 来自专栏音视频技术

    奇声(IQDubbing)-- 面向影视剧的AI配音技术

    爱奇艺在自有的海量内容优势下,基于Voice Conversion,MDX,Denoise等AI技术,研发了面向影视剧场景的AI配音技术IQDubbing,有效地缓解了影视剧配音本地化的问题。 LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践 本次分享将从以下几个方面展开:第一,从配音知识展开介绍现代影视剧配音的背景,面临困难与挑战,第二部分重点介绍奇声(IQDubbing)的业务体系与流程;第三部分重点介绍奇声(IQDubbing)的技术架构及关键技术实现 以上是我们所运用的部分算法,IQDubbing是一个全链路的解决方案,是基于所有单点技术开发的平台,将所有的单点技术按照配音流程串联起来。 3.6 配音评价体系 评价体系是非常重要的,我们需要从技术和业务两个维度评判声音输出。 技术维度方面,是算法团队自己的维度,简单说是通过技术角度测评。

    3.1K20编辑于 2023-04-04
  • 来自专栏全栈开发日记

    自动批量真人配音软件

    工具名称:自动批量配音软件 运行系统:Windows 工具大小:6.5MB 工具截图: 使用方法: 需要设置阿里参数或腾讯参数,点击相应参数后的【获取】,可自动跳转到相应的获取页面(免费)。

    1.9K20编辑于 2022-05-13
  • 来自专栏算法与数据结构

    PTA 7-2 符号配对(20 分)

    7-2 符号配对(20 分) 请编写程序检查C语言源程序中下列符号是否配对:/*与*/、(与)、[与]、{与}。 输入格式: 输入为一个C语言源程序。

    6.1K71发布于 2017-12-29
  • 来自专栏刷题笔记

    7-2 树种统计 (20 分)

    本文链接:https://blog.csdn.net/shiliang97/article/details/102924532 7-2 树种统计 (20 分) 随着卫星成像技术的应用,自然资源研究机构可以识别每一棵树的种类

    1.1K10发布于 2019-11-07
  • 来自专栏刷题笔记

    7-2 到底有多二

    本文链接:https://blog.csdn.net/shiliang97/article/details/96301355 7-2 到底有多二 一个整数“犯二的程度”定义为该数字中包含2的个数与其位数的比值

    75430发布于 2019-11-08
  • 来自专栏freesan44

    PTA 7-2 找奇葩 (20 分)

    在一个长度为 n 的正整数序列中,所有的奇数都出现了偶数次,只有一个奇葩奇数出现了奇数次。你的任务就是找出这个奇葩。

    32020发布于 2021-09-10
  • PTA 7-2 方阵循环右移

    9710编辑于 2025-12-16
  • 来自专栏freesan44

    PTA 7-2 数字之王 (20 分)

    的每个数的各位数的立方相乘,再将结果的各位数求和,得到一批新的数字,再对这批新的数字重复上述操作,直到所有数字都是 1 位数为止。这时哪个数字最多,哪个就是“数字之王”。

    30620编辑于 2021-12-06
  • 2026年TTS配音工具分层选型:从轻量应用到云端API的技术对比

    面向开发者和内容创作者,基于2026年5月实测数据,对比轻量人工工具与云端API的适用场景、技术指标和成本,提供技术选型参考。不吹不黑,只列客观参数。 在开发视频自动配音、短剧角色生成、智能语音交互等系统时,TTS(文本转语音)是常见的基础能力。 (如“小明说:”)并分配不同声线,一键生成多角色对话声音克隆:支持5-10秒录音生成个人声音模型(技术来源为阿里达摩院),还原度较高技术门槛:低适用场景:短剧多角色、有声书多人演播、小说推文、虚拟主播角色配音 三、云端API方案:主流服务技术指标对比当项目需要批量生成(月产超过10万字)或实时交互时,建议评估云端TTSAPI。以下为几款主流方案的关键技术指标(基于国内数据中心节点实测)。 四、多角色短剧配音的自动化实现路径对于需要区分不同角色声线的短剧项目,建议采用以下技术路径:人工验证阶段:使用支持自动角色分配的轻量工具(免费试用)上传剧本,观察角色-声线映射效果,确定每个角色对应的voice_type

    3900编辑于 2026-05-09
  • 来自专栏刷题笔记

    7-2 冒泡法排序 (30分)

    7-2 冒泡法排序 (30分) 将N个整数按从小到大排序的冒泡排序法是这样工作的:从头到尾比较相邻两个元素,如果前面的元素大于其紧随的后面元素,则交换它们。

    1.3K10发布于 2020-06-23
  • 来自专栏刷题笔记

    7-2 冒泡法排序 (30分)

    将N个整数按从小到大排序的冒泡排序法是这样工作的:从头到尾比较相邻两个元素,如果前面的元素大于其紧随的后面元素,则交换它们。通过一遍扫描,则最后一个元素必定是最大的元素。然后用同样的方法对前N−1个元素进行第二遍扫描。依此类推,最后只需处理两个元素,就完成了对N个数的排序。

    1.1K10发布于 2020-06-23
  • 来自专栏算法与数据结构

    PTA 7-2 列车调度(25 分)

    7-2 列车调度(25 分) 火车站的列车调度铁轨的结构如下图所示。 两端分别是一条入口(Entrance)轨道和一条出口(Exit)轨道,它们之间有N条平行的轨道。

    2.6K90发布于 2017-12-29
  • 来自专栏数据结构和算法

    7-2 歌唱比赛计分 (15分)

    7-2 歌唱比赛计分 (15分) 设有10名歌手(编号为1-10)参加歌咏比赛,另有6名评委打分,每位歌手的得分从键盘输入,计算出每位歌手的最终得分(扣除一个最高分和一个最低分后的平均分),最后按最终得分由高到低的顺序输出每位歌手的编号及最终得分

    30510编辑于 2023-11-30
  • 来自专栏freesan44

    PTA 7-2 找奇葩 (20 分)

    在一个长度为 n 的正整数序列中,所有的奇数都出现了偶数次,只有一个奇葩奇数出现了奇数次。你的任务就是找出这个奇葩。

    27210编辑于 2021-12-06
  • 来自专栏freesan44

    PTA 7-2 数字之王 (20 分)

    的每个数的各位数的立方相乘,再将结果的各位数求和,得到一批新的数字,再对这批新的数字重复上述操作,直到所有数字都是 1 位数为止。这时哪个数字最多,哪个就是“数字之王”。

    27200发布于 2021-09-11
  • 2026年TTS配音软件技术选型:从云端API到轻量级效率工具

    实测7款TTS方案,含延迟、成本、音质数据及代码示例在开发技术教程配音、智能客服、开源项目演示等场景时,文本转语音(TTS)是一项基础能力。 本文从技术视角实测了火山引擎TTS、AzureTTS、ElevenLabs等5款云API,并补充3款轻量级人工工具(配朵朵、叮叮配音、媒小三配音)的核心参数。 其神经拟人模型对技术术语的重音处理准确,适合教程类内容。 二、轻量工具方案(无API,适合人工操作)以下三款工具没有开放API,无法程序化调用,但在日常人工配音场景中操作便捷、免费额度实用。以下为客观参数描述,供非技术场景选型参考。 +App+小程序价格模式每日免费试用+会员制音色数量1300+种,含20种情绪表达声音克隆支持(5-10秒录音克隆,阿里达摩院技术合作)会员包含功能克隆+配音+AI写作+文案提取+爆文标题+脚本模板典型用途个人

    35610编辑于 2026-04-30
  • 短剧出海翻译中的音画同步难题:AI 配音时长自适应与口型适配技术方案

    做过短剧出海翻译的团队大概都踩过同一个坑:字幕翻译完了,配音也生成了,合到视频里一看:角色嘴已经闭上了,配音还在继续说。或者反过来,角色还在说话,配音已经结束了,画面里剩下一段尴尬的静默。 本文从这个具体的技术问题出发,拆解语速自适应控制和口型适配两个技术方向的实现思路,并分享一些实际落地中的工程经验和当前局限。一、问题定义:翻译后的时长偏差从哪来要解决音画错位,首先要理解偏差的来源。 三、口型适配:一个更难的技术方向语速自适应解决的是"配音时长和视频时长对不上"的问题。但还有一个更细粒度的问题——口型适配。 也就是说,即使配音的总时长和视频的总时长一致了,观众仍然可能注意到角色的嘴型和听到的声音对不上。口型适配在技术上可以拆成两条路线。 更精细的口型适配、更自然的情感保持、更智能的多角色协调,是这个技术方向接下来需要持续投入的课题。

    23410编辑于 2026-04-23
  • 配音工具技术选型:从轻量小程序到高保真TTS API的最佳实践

    我从去年开始深度研究配音相关的技术路线,实测了从轻量级小程序到企业级TTSAPI的多种方案,最终确定了三款值得关注、可纳入技术选型参考的工具,加上几款主流API和开源方案做对比。 今天将这些实测经验整理出来,供大家在技术选型和技术教程配音时参考——本文不构成商业推广,以下结论均基于个人长时间实机测试。 一、为什么需要关注配音技术从我自己的项目经验来看,在两种场景下,配音能力尤其关键:技术教程和开源项目演示:通过高质量的自动配音大幅降低内容制作成本,而且比人工录音可控性更强,方便分发给不同语种的受众。 这些是嵌入AIAgent或云原生应用时真正关键的技术要素。二、三款值得关注的国内配音工具(我的实测体验)以下三款工具在国内创作者群体中口碑较好,各有侧重。 纯免费的路线在这个量级中确实非常难得,并且音色的多样性完全满足日常教程配音和产品介绍的需求。技术约束:无公开API,不支持声音克隆和精细化语调调节。

    29110编辑于 2026-04-28
领券