首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏bunny的专栏

    【玩转Lighthouse】轻松搭建视频配音工具晓晓配音

    今天我们将给大家介绍如何使用Lighthouse轻量服务器搭建一个属于自己的在线视频配音工具,可以将文案制作为mp3文件并且生成对应的字幕视频,以便大家在制作视频的过程中方便地为自己的视频添加自然逼真的配音 推荐同学们买一台作为学习使用,用来部署晓晓配音完全绰绰有余 image.png 购买完成后我们可以在控制台重置其系统为Ubunut+Docker专版,由于此系统自带了Docker环境,我们上手就能立刻开始部署 我们需要在防火墙放行对应的端口,推荐一次性开一个范围的端口,这样我们在部署服务的时候就可以不用每次都到控制台编辑规则了 20220414190405.png 登录我们的轻量服务器,然后在任意目录克隆晓晓配音的源代码 ,因此晓晓配音的链接有效期并不长,生成的mp4和mp3文件都是定时过期的 mkdir /tts_storage 然后,我们可以使用-v 参数将此目录作为缓存挂载到容器内部,同时使用-e 传递可用的端口号给容器服务使用 然后使用docker logs查看容器服务是否正常开启 docker logs ms_tts 当看到服务顺利监听到8019端口后,部署就完成了 run.png 最后我们就可以通过ip端口的方式访问晓晓配音服务了

    1.9K100编辑于 2022-04-14
  • 来自专栏悟道

    2-5 快速幂模板

    这个就是在快速乘的基础上改一下 sum=0--->sum=1 x+=x--->x*=x //快速幂模板 public double quickPow(double x,long y){ double sum=1; while(y>0){ if((y&1)==1){ sum*=x; } x*=x; y=y>>1; }

    33620发布于 2021-06-01
  • 来自专栏音视频技术

    奇声(IQDubbing)-- 面向影视剧的AI配音技术

    爱奇艺在自有的海量内容优势下,基于Voice Conversion,MDX,Denoise等AI技术,研发了面向影视剧场景的AI配音技术IQDubbing,有效地缓解了影视剧配音本地化的问题。 LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践 简单自我介绍下,我是李海,目前主要负责爱奇艺在成都的算法团队,负责影视剧AI配音技术方面的研究和工作。 要想将AI技术真正的落地到影视剧配音当中,在解决人声问题的同时还要解决影片中其他声音的部分。 那么,配音究竟是在做什么?是怎样的一个流程? 在爱奇艺AI配音场景下有很多海外剧集,海外剧包含英语、印度语、俄语等其他各国语言,翻译则是双向的,在爱奇艺剧集出海时需要把中文翻译成对应国家语言;第三步,配音本制作。

    3.1K20编辑于 2023-04-04
  • 来自专栏AI机器学习与深度学习算法

    学习分类 2-5 线性可分

    感知机非常简单同时又很容易理解,但是相对应的,缺点也很多。感知机最大的缺点就是它只能解决线性可分的问题。

    55810编辑于 2022-11-08
  • 来自专栏全栈开发日记

    自动批量真人配音软件

    功能见名思意,可以将文本转为AI智能语音,支持阿里云和腾讯两种接口,简单实用。可批量执行,将需要转的文字放到txt文档中即可,转三千字大概需要一分钟左右,受电脑配置影响。 工具名称:自动批量配音软件 运行系统:Windows 工具大小:6.5MB 工具截图: 使用方法: 需要设置阿里参数或腾讯参数,点击相应参数后的【获取】,可自动跳转到相应的获取页面(免费)。

    1.9K20编辑于 2022-05-13
  • 从轻量试听到API生产:2026常见AI配音方案整理

    一开始原本只是想解决“批量生成配音”的问题,但真正做下来后发现,影响最终效果的其实不仅是模型本身,还包括:文案断句停顿控制voice_type选择长文本切分字幕时间轴音频拼接尤其中文场景,对“节奏感”会非常敏感 这篇主要记录一下最近测试几种AI配音方案时的一些实现过程,以及不同阶段适合的技术路线。一、项目背景:为什么没有直接上API最开始的方案其实很简单:文本→TTSAPI→返回MP3。 目前测试下来,像:叮叮配音配朵朵媒小三配音剪映AI配音这类封装型工具,在前期验证阶段会明显提高效率。尤其在处理:男声旁白多角色对话悬疑解说科普类视频时,直接试听会比反复调API参数更直观。 后来拆分后发现:中文AI配音里,“断句”比情绪参数影响更大。比如:text_list=["很多人以为鲸鱼不会交流。","但实际上,它们拥有复杂的声音系统。"]这种短句分段后,听感会明显比长句自然。

    4110编辑于 2026-05-09
  • 来自专栏Hank’s Blog

    2-5 R语言基础 factor

    #因子:分类数据 #有序和无序 #整数向量+标签label #Male/Female #常用于lm(),glm()

    41610发布于 2020-09-16
  • 来自专栏刷题笔记

    2-5 Two Stacks In One Array (20 分)

    本文链接:https://blog.csdn.net/shiliang97/article/details/101173005 2-5 Two Stacks In One Array (20 分) Write

    72030发布于 2019-11-08
  • 来自专栏Deep learning进阶路

    2-5 线性表之循环链表

    2-5 线性表之循环链表 循环链表就是链表首尾相接连成一个环,可以用单链表 和 循环链表来实现。

    41340发布于 2019-07-02
  • 来自专栏NetCore 从壹开始

    2-5 安装容器Web工具:Docker Portainer

    现在已经习惯了容器化了,不仅可以很快的配合CICD来实现部署,同时主要是也能解决一些疑难杂症,比如在Linux中经常会有各种图形图像的依赖包问题。特别是内网环境。

    95920编辑于 2023-01-09
  • 来自专栏刷题笔记

    2-5 修理牧场 (35 分)【优先队列】

    2-5 修理牧场 (35 分) 农夫要修理牧场的一段栅栏,他测量了栅栏,发现需要N块木头,每块木头长度为整数L​i​​个长度单位,于是他购买了一条很长的、能锯成N块的木头,即该木头的长度是L​i​​的总和

    1K10发布于 2020-06-23
  • 来自专栏量子位

    这个AI能自动给视频配音,真假难辨(不服来试)

    视频内容 你将看到两段画面相同的视频,请判断哪段来自视频原声,哪段是AI根据视频画面配上的假声? 莫非两个都是真的?不可能,答案文末揭晓。 (还有更多真假难辨的视频原声和配音大对比) 真假难辨,简直让人怀疑耳朵。模型合成的假音效,什么时候都这么逼真了?一切还得从这个自动为自然环境下的视频配音的项目说起。 ? 视听关联 看闪电,知雷声。 每个场景的配音均为一真一假,当场揭晓答案,猜猜你能对几个——

    3K50发布于 2018-04-02
  • 来自专栏育种数据分析之放飞自我

    笔记 | GWAS 操作流程2-5:杂合率检验

    一般自然群体,基因型个体的杂合度过高或者过低,都不正常,我们需要根据杂合度进行过滤。偏差可能表明样品受到污染,近亲繁殖。我们建议删除样品杂合率平均值中偏离±3 SD的个体。

    2.3K20发布于 2020-04-27
  • 来自专栏CoderJia的工作笔记

    KrillinAI:基于AI大模型的一站式视频翻译配音解决方案

    项目概述 KrillinAI是一款基于AI大模型技术的全流程视频翻译和配音工具,旨在为内容创作者提供从视频下载到最终成品的一站式解决方案。 多样化配音与语音克隆 完成翻译后,KrillinAI支持将文本转换为自然流畅的语音。 系统提供了多种配音选项,默认集成了CosyVoice的语音合成技术,用户还可以上传自己的语音样本进行声音克隆,实现个性化的配音效果。 系统支持多种AI服务提供商的配置,包括: OpenAI:用于转录和大语言模型服务 本地模型:faster-whisper用于本地语音识别 阿里云:提供语音服务、大模型服务和OSS云存储支持 安装和使用教程 AI驱动的智能处理:利用大语言模型进行字幕分段和翻译,质量远超传统基于规则的方法。 开源可定制:作为开源项目,用户可以根据自己的需求进行修改和扩展。

    1.8K10编辑于 2025-04-16
  • 腾讯云AI赋能游戏全生命周期:重塑效率与创造的技术实践

    构建全链方案:AI赋能游戏研发与运营的关键技术 腾讯云提供覆盖游戏全生命周期的AI解决方案,核心模块包括: AI多模态生成: AI生文/生图:混元hunyuan-turbo(文本生成)、混元生图 AI生3D:文生3D/图生3D、生成PBR贴图(混元3D管线),几何与纹理解耦生成,支持自动绑骨蒙皮、动作驱动。 AI音频:角色配音、背景音乐、玩家陪玩(如《和平精英》AI队友“花傲天”)。 HAI平台部署效率:应用创建约2-5分钟,预置Ubuntu2024、Python 3.10、Stable Diffusion v1-5等环境。 《太空杀》:AI玩家(混元Turbo S驱动)扮演内鬼,展现独立思考与博弈能力(2真人+8 AI对战)。 高效部署:应用创建2-5分钟,支持WebUI/ComfyUI可视化交互、云端IDE。 成本优化:存算分离、关机不计费、应用存档(多地可用),专属网络加速学术资源下载。

    34120编辑于 2026-05-01
  • 来自专栏机器之心

    MIT、IBM联合打造AI配音师:检测动作自动添加音效,视频「无声」胜「有声」

    说起计算机音乐的发展史,还要追溯到 1951 年,英国计算机科学家艾伦 · 图灵是第一位录制计算机生成音乐的人。近年来,深度神经网络的出现促使了利用大规模音乐数据进行训练来生成音乐的相关工作。

    1.1K20发布于 2020-08-28
  • 来自专栏新智元

    德国小哥用AI拍大片!GPT-2写台词、StyleGAN做特效、Replica来配音

    ---- 新智元报道 来源:towardsdatascience 编辑:白峰、永上 【新智元导读】最近,国外一个技术极客Alex看了电影《阳光泉水》后深受启发,决定自己用AI来生成一部。 Vlad Alex知道了这些后,激动不已,觉得自己也能让AI来拍一部电影,结果真的成功了。 如何制作自己的AI电影呢? 作为 Amazon AWS ai / ml 服务的一部分,Polly 提供各种语言的大量语音,但是Polly产生的语音更像主持人,并不总是适合虚构的内容。 EmptyRoom为我们展示了机器学习在生成视频方面的巨大潜力,不仅简化了流程,还分享了许多创造性的结果,当灵感枯竭的时候也许AI能带给你一股清泉,一起拥抱人工智能吧! 参考链接: https://towardsdatascience.com/ai-as-a-movie-maker-e5865b99a06c

    1.9K30发布于 2020-06-05
  • 短剧出海翻译中的音画同步难题:AI 配音时长自适应与口型适配技术方案

    做过短剧出海翻译的团队大概都踩过同一个坑:字幕翻译完了,配音也生成了,合到视频里一看:角色嘴已经闭上了,配音还在继续说。或者反过来,角色还在说话,配音已经结束了,画面里剩下一段尴尬的静默。 如果TTS引擎没有对情感参数做精细控制,生成的配音节奏和原始表演的节奏就会产生额外偏差。 下面这张图展示了一个典型的音画错位场景——原始中文音频和视频画面完美对齐,但翻译成英语后,由于文本膨胀,每个句段的配音时长都发生了变化,导致整条时间轴逐步偏移。图1:翻译后配音的音画时长错位问题模型。 第二条路线是视频侧适配:用AI直接修改视频中角色的嘴部区域,使其匹配目标语言的配音节奏。 四、工程落地:narrator-ai在时长控制上的实现上面讲的算法思路落到实际工程中,需要一套完整的处理管线来串联各个环节。这里以开源项目NarratorAI的翻译模块为例,说明一下具体的实现方式。

    23310编辑于 2026-04-23
  • 腾讯云AI赋能游戏全生命周期,驱动研发效率与玩家体验革新

    内容创新不足:过度依赖IP和"换皮"现象普遍,核心玩法缺乏创新导致用户审美疲劳 生产效率瓶颈:传统游戏皮肤生产管线需耗时9个月,其中概念设计和制作实现环节占据60%以上的人力投入 腾讯云全链AI 解决方案实现降本增效 基于混元大模型矩阵,提供覆盖游戏研发全流程的AI能力: AI生文/生图:混元hunyuan-turbo支持剧情生成、文案创作 AI代码:混元hunyuan-code实现代码自动生成与测试 AI生3D:文生3D/图生3D生成PBR贴图,支持360°全视角展示 AI NPC:混元hunyuan-role实现角色扮演与智能陪伴 AI音频:支持角色配音、背景音乐生成 量化效果显著提升研发与运营效率 2D设计提效超30%:概念设计阶段实现分钟级应用生成,大幅缩短创作周期 3D资产生产效率提升70%+:传统专业人工美术管线需5-7天,混元3D AI管线仅需10分钟 运营投放效果提升:AI素材使广告回报率提升 提升活动参与度 腾讯云技术领先性保障方案可靠性 混元大模型多模态能力行业领先:在文生图、文生视频等多模态模型榜单位列前三(数据来源:行业评测) HAI平台降低使用门槛:一键部署ComfyUI,应用创建仅需2-

    19510编辑于 2026-05-01
  • 来自专栏九彩拼盘的叨叨叨

    学习前端 第4周 第2-5

    了解什么叫响应式。 了解CSS3 Media Queries 了解Bootstrap 了解Bootstrap的全局 CSS 样式。特别是其中的栅格系统。 作业 用Bootstrap做页面 http://www.bootcss.com/ 。交互不需要实现

    19610发布于 2018-08-27
领券