首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏bunny的专栏

    【玩转Lighthouse】轻松搭建视频配音工具晓晓配音

    今天我们将给大家介绍如何使用Lighthouse轻量服务器搭建一个属于自己的在线视频配音工具,可以将文案制作为mp3文件并且生成对应的字幕视频,以便大家在制作视频的过程中方便地为自己的视频添加自然逼真的配音 ms-tts-web (github.com) github.png 一、购买一台轻量服务器 腾讯云的学生优惠是相当给力的,2核4G一年只要120:https://curl.qcloud.com/nWe9dgEz 推荐同学们买一台作为学习使用,用来部署晓晓配音完全绰绰有余 image.png 购买完成后我们可以在控制台重置其系统为Ubunut+Docker专版,由于此系统自带了Docker环境,我们上手就能立刻开始部署 我们需要在防火墙放行对应的端口,推荐一次性开一个范围的端口,这样我们在部署服务的时候就可以不用每次都到控制台编辑规则了 20220414190405.png 登录我们的轻量服务器,然后在任意目录克隆晓晓配音的源代码 然后使用docker logs查看容器服务是否正常开启 docker logs ms_tts 当看到服务顺利监听到8019端口后,部署就完成了 run.png 最后我们就可以通过ip端口的方式访问晓晓配音服务了

    1.9K100编辑于 2022-04-14
  • 来自专栏音视频技术

    奇声(IQDubbing)-- 面向影视剧的AI配音技术

    爱奇艺在自有的海量内容优势下,基于Voice Conversion,MDX,Denoise等AI技术,研发了面向影视剧场景的AI配音技术IQDubbing,有效地缓解了影视剧配音本地化的问题。 LiveVideoStackCon 2022上海站大会邀请到了爱奇艺 AI算法高级经理 李海老师,为我们分享现代影视剧配音面临的挑战,以及面向影视剧的AI配音技术 —— 奇声(IQDubbing)的技术实现与应用实践 简单自我介绍下,我是李海,目前主要负责爱奇艺在成都的算法团队,负责影视剧AI配音技术方面的研究和工作。 要想将AI技术真正的落地到影视剧配音当中,在解决人声问题的同时还要解决影片中其他声音的部分。 那么,配音究竟是在做什么?是怎样的一个流程? 在爱奇艺AI配音场景下有很多海外剧集,海外剧包含英语、印度语、俄语等其他各国语言,翻译则是双向的,在爱奇艺剧集出海时需要把中文翻译成对应国家语言;第三步,配音本制作。

    3.1K20编辑于 2023-04-04
  • 来自专栏全栈开发日记

    自动批量真人配音软件

    功能见名思意,可以将文本转为AI智能语音,支持阿里云和腾讯两种接口,简单实用。可批量执行,将需要转的文字放到txt文档中即可,转三千字大概需要一分钟左右,受电脑配置影响。 工具名称:自动批量配音软件 运行系统:Windows 工具大小:6.5MB 工具截图: 使用方法: 需要设置阿里参数或腾讯参数,点击相应参数后的【获取】,可自动跳转到相应的获取页面(免费)。

    1.9K20编辑于 2022-05-13
  • 从轻量试听到API生产:2026常见AI配音方案整理

    一开始原本只是想解决“批量生成配音”的问题,但真正做下来后发现,影响最终效果的其实不仅是模型本身,还包括:文案断句停顿控制voice_type选择长文本切分字幕时间轴音频拼接尤其中文场景,对“节奏感”会非常敏感 这篇主要记录一下最近测试几种AI配音方案时的一些实现过程,以及不同阶段适合的技术路线。一、项目背景:为什么没有直接上API最开始的方案其实很简单:文本→TTSAPI→返回MP3。 目前测试下来,像:叮叮配音配朵朵媒小三配音剪映AI配音这类封装型工具,在前期验证阶段会明显提高效率。尤其在处理:男声旁白多角色对话悬疑解说科普类视频时,直接试听会比反复调API参数更直观。 后来拆分后发现:中文AI配音里,“断句”比情绪参数影响更大。比如:text_list=["很多人以为鲸鱼不会交流。","但实际上,它们拥有复杂的声音系统。"]这种短句分段后,听感会明显比长句自然。

    3510编辑于 2026-05-09
  • 来自专栏量子位

    这个AI能自动给视频配音,真假难辨(不服来试)

    视频内容 你将看到两段画面相同的视频,请判断哪段来自视频原声,哪段是AI根据视频画面配上的假声? 莫非两个都是真的?不可能,答案文末揭晓。 (还有更多真假难辨的视频原声和配音大对比) 真假难辨,简直让人怀疑耳朵。模型合成的假音效,什么时候都这么逼真了?一切还得从这个自动为自然环境下的视频配音的项目说起。 ? 视听关联 看闪电,知雷声。 每个场景的配音均为一真一假,当场揭晓答案,猜猜你能对几个——

    3K50发布于 2018-04-02
  • 来自专栏CoderJia的工作笔记

    KrillinAI:基于AI大模型的一站式视频翻译配音解决方案

    项目概述 KrillinAI是一款基于AI大模型技术的全流程视频翻译和配音工具,旨在为内容创作者提供从视频下载到最终成品的一站式解决方案。 多样化配音与语音克隆 完成翻译后,KrillinAI支持将文本转换为自然流畅的语音。 系统提供了多种配音选项,默认集成了CosyVoice的语音合成技术,用户还可以上传自己的语音样本进行声音克隆,实现个性化的配音效果。 系统支持多种AI服务提供商的配置,包括: OpenAI:用于转录和大语言模型服务 本地模型:faster-whisper用于本地语音识别 阿里云:提供语音服务、大模型服务和OSS云存储支持 安装和使用教程 AI驱动的智能处理:利用大语言模型进行字幕分段和翻译,质量远超传统基于规则的方法。 开源可定制:作为开源项目,用户可以根据自己的需求进行修改和扩展。

    1.8K10编辑于 2025-04-16
  • 来自专栏机器之心

    MIT、IBM联合打造AI配音师:检测动作自动添加音效,视频「无声」胜「有声」

    说起计算机音乐的发展史,还要追溯到 1951 年,英国计算机科学家艾伦 · 图灵是第一位录制计算机生成音乐的人。近年来,深度神经网络的出现促使了利用大规模音乐数据进行训练来生成音乐的相关工作。

    1.1K20发布于 2020-08-28
  • 来自专栏新智元

    德国小哥用AI拍大片!GPT-2写台词、StyleGAN做特效、Replica来配音

    ---- 新智元报道 来源:towardsdatascience 编辑:白峰、永上 【新智元导读】最近,国外一个技术极客Alex看了电影《阳光泉水》后深受启发,决定自己用AI来生成一部。 Vlad Alex知道了这些后,激动不已,觉得自己也能让AI来拍一部电影,结果真的成功了。 如何制作自己的AI电影呢? 作为 Amazon AWS ai / ml 服务的一部分,Polly 提供各种语言的大量语音,但是Polly产生的语音更像主持人,并不总是适合虚构的内容。 EmptyRoom为我们展示了机器学习在生成视频方面的巨大潜力,不仅简化了流程,还分享了许多创造性的结果,当灵感枯竭的时候也许AI能带给你一股清泉,一起拥抱人工智能吧! 参考链接: https://towardsdatascience.com/ai-as-a-movie-maker-e5865b99a06c

    1.9K30发布于 2020-06-05
  • 短剧出海翻译中的音画同步难题:AI 配音时长自适应与口型适配技术方案

    做过短剧出海翻译的团队大概都踩过同一个坑:字幕翻译完了,配音也生成了,合到视频里一看:角色嘴已经闭上了,配音还在继续说。或者反过来,角色还在说话,配音已经结束了,画面里剩下一段尴尬的静默。 如果TTS引擎没有对情感参数做精细控制,生成的配音节奏和原始表演的节奏就会产生额外偏差。 下面这张图展示了一个典型的音画错位场景——原始中文音频和视频画面完美对齐,但翻译成英语后,由于文本膨胀,每个句段的配音时长都发生了变化,导致整条时间轴逐步偏移。图1:翻译后配音的音画时长错位问题模型。 第二条路线是视频侧适配:用AI直接修改视频中角色的嘴部区域,使其匹配目标语言的配音节奏。 四、工程落地:narrator-ai在时长控制上的实现上面讲的算法思路落到实际工程中,需要一套完整的处理管线来串联各个环节。这里以开源项目NarratorAI的翻译模块为例,说明一下具体的实现方式。

    23310编辑于 2026-04-23
  • 来自专栏ADAS性能优化

    AI Weekly | Nov. 9, 2019

    Researchers tout AI that can predict 25 video frames into the future In a preprint paper, researchers propose an AI model that can predict up to 25 video frames into the future given only two to five starting Applause targets AI bias by sourcing training data at scale Software-testing company Applause wants to reinvent AI testing with a service that detects AI bias by crowdsourcing larger training data sets. Remember that scary AI text-generator that was too dangerous to release?

    28110编辑于 2022-05-13
  • 来自专栏白话互联

    Ai Agent】Ai Agent News | 9月11日速递

    今天是9月11日星期四,让我们一起来看看今天 Ai Agent 带来的 AI 领域的重要动态吧! ❤ Indeed Unveils AI Agents for Job Seekers and Recruiters 求职招聘领域迎来AI助手新时代 Indeed推出了两款AI Agents,分别面向求职者和招聘方 ❤ Secure AI Agents at Runtime with Docker Docker推出AI Agent运行时安全解决方案 Docker发布了关于如何在运行时保护AI Agent的新方法, 随着AI工具的强大和普及,它们也变得不可预测且易受攻击。从LLM输出中的幻觉到提示注入,AI工作流面临多重安全威胁。 AI Agent时嵌入运行时安全,为AI原生开发提供更可靠的安全保障。

    34310编辑于 2025-09-17
  • 来自专栏月色的自留地

    从锅炉工到AI专家(9)

    Epoch 8 Step 1207755: lr = 0.015 words/sec = 401 Eval 4965/17827 accuracy = 27.9% Epoch 9

    81460发布于 2018-06-20
  • 来自专栏圣杰的专栏

    .NET+AI | Agent | 人机协作(9

    通过 ApprovalRequiredAIFunction 为敏感工具加上人工审批环节,快速构建符合企业合规要求的 MAF 人机协作智能体。

    22810编辑于 2025-12-28
  • 来自专栏新智元

    AI配音版Sora视频刷屏!绝美逼真音效打破「无声电影」,或颠覆万亿美元产业

    语音初创公司ElevenLabs放大招,直接用AI给Sora经典视频完成了配音。网友惊呼离AI完全生成电影又近了一步。 就在今天,AI语音克隆初创公司ElevenLabs给经典的Sora演示视频,完成了绝美的配音。 听过之后,让人简直颅内高潮。 在片尾,ElevenLabs表示,以上所有的配音全部由AI生成,没有一点编辑痕迹。 网友惊呼,「这简直离完全由AI生成电影又近了一步」! 堪称突破后的突破! 同时,公司还宣布推出了一系列新产品,包括声音市场、AI 配音工作室和移动应用等。 自去年1月发布beta版平台以来,ElevenLabs便受到了创作者们的热捧。 2023年3月,流媒体自动化服务Super-Hi-Fi携手ElevenLabs,利用后者的软件和ChatGPT生成的提示词,为其虚拟DJ配音,推出了全自动的「AI Radio」广播服务。

    40910编辑于 2024-02-26
  • 来自专栏量子位

    你家的猫也能来段东北话了:快手快影一键「智能配音」,三种方言随意换,还能配出《舌尖》风

    实现如此功能的,就是快手快影最新上线的AI黑科技——智能配音。 输入文字,AI配音 所谓智能配音,就是用户只需输入文字,软件就能自动将之转化为高质量的视频配音。 使用方法非常简单。 配音音频就秒速生成了。 ? 另外,通过「字幕」→「加字幕」,完成字幕输入后,同样会出现「智能配音」的入口。操作相当方便。 ? 目前,智能配音功能中一共有9位「发音人」可以pick。 而对于C端用户,特别是有视频配音需求的用户而言,AI配音只有更生动、更自然、更具韵律,才能真正满足他们的需求。 另外,面向B端的产品,可以对文本的规律、意义进行限定。 最后呈现出的9种不同音色背后,就有100+实验。 ? 另一个让研发人员印象深刻的难题,是中英混读问题。 用户在实际使用过程中,很可能会出现中文、英文混合使用的情况,但这就给音源的采集带来了困难。 接地气,还看黑科技 智能配音这样的AI黑科技,无疑给老铁们带来了船新的玩法,引领了一波短视频新热潮。 其实,这已经不是快手第一次贴合用户需求,在产品里融入AI黑科技了。

    2.2K30发布于 2020-07-21
  • 来自专栏软件安装

    国产VS海外:12款国产AI视频工具横向对比实测,感觉国产没想的这么差

    核心功能: ① AI自动生成视频 操作流程极其简单:输入文案 → 选择配音音色 → 一键生成视频。系统会自动匹配画面素材、生成字幕、添加配音。 腾讯智音:大厂出品的AI创作工具 腾讯智音是腾讯推出的AI智能创作工具,拥有AI数字人、AI文字配音、文章转视频等多项AIGC能力。 ② 文本配音 输入文本 → 选择音色 → 自动配音,操作简单,很多音色免费使用。 ③ 文章转视频 输入文本 → 设置成片类型、视频比例、背景音乐、朗读音色 → 一键AI创作。 优点: 中文友好,操作简便 可控制视频速度 每天免费点数 缺点: 功能相对基础 生成效果不如专业工具 适用场景: 快速创作、测试想法 9. 优点: 生成风格有限制 可创建人物角色 缺点: 无法调整运镜 需要访问国外网站 适用场景: 英文环境用户、国际化内容 说是12款,其实9款国产加6款国外,已经提供更多的举例了。

    3.7K10编辑于 2026-03-26
  • AI日报 - 2025年4月9

    "GRMs不仅依赖现有原则,还能自我创建和批判原则" - DeepSeek研究团队undefined 该方法已在arXiv发布论文,或将重塑模型优化范式1.2 特斯拉FSD实现零干预驾驶#自动驾驶 #AI Drive到Santa Monica全程零干预驾驶 ⚡ 穿越两条高速公路和城市街道,尚未发布v13版本 行业影响:▸ 证明纯视觉方案在复杂场景中的可靠性▸ 加速L4级自动驾驶商业化进程"@Tesla_AI GDPR法规#数据政策 #欧盟 #监管 | 影响指数:★★★☆☆ 核心进展:欧盟委员会计划未来几周提出GDPR削减提案,减少企业合规负担 ⚡ 2018年实施以来首次重大调整 行业影响:▸ 可能释放欧洲AI 应用成本下降"开放生态是AI民主化的关键" - NVIDIA发言人undefined 模型已在Hugging Face发布,商用前景广阔️ 二、技术前沿 (Tech Radar)2.1 自我原则批判调优 医疗 ▲▲▲ ▲▲▲▲ ▲▲▲▲ ▲▲ 工业AI ▲▲▲▲ ▲▲ ▲▲▲ ▲▲▲ 零售AI ▲▲▲ ▲ ▲

    35900编辑于 2025-04-08
  • AI日报 - 2025年3月9

    AI日报 - 2025年3月9日 今日概览(60秒速览) ▎ AGI突破 | 新基准IFIR发布,挑战AI在未知模拟世界中的问题解决能力 算法突破:潜在令牌压缩推理步骤方法提升语言模型效率 ▎ 4.0创作女性节虚拟花束,AI+创意场景落地 AI代理24/7自动运行50个社交媒体账号 一、今日热点 (Hot Topic)1.1 AnthropicAI宣布2025年将公开讨论AGI伦理与趋势 ⚡ 首场议题:AI对齐策略如何避免Goodhart效应 行业影响: ▸ 推动行业对AGI伦理框架的标准化探讨 ▸ 可能影响全球政策制定者对AI监管的立场 "AGI的透明度不应仅停留在技术层面, AI功能集成 ▸ 保险公司开发动态保费定价模型 趋势:2025年医疗AI合规性认证标准将出台 行业热力图(按领域划分): 领域 融资热度政策支持技术突破市场接受度开源模型 :当前AI评估体系亟待突破人类中心主义框架

    58910编辑于 2025-03-09
  • AI论文生成不用愁!9AI工具大推荐

    本文会为您推荐9款出色的AI论文生成工具,助力您轻松应对论文写作过程中遇到的挑战。1. 瑞达写作:论文创作的得力助手工具简介:只要输入论文题目,就能一键生成高达5万字的论文初稿。 未针对AIGC检测处理,AI率较高。可能编造虚假参考文献。6. Grammarly:论文语言优化专家工具简介:Grammarly主要提供语法检查功能,也具备AI写作功能,可优化论文语言流畅度和语法。 Jasper AI:全面AI写作工具工具简介:Jasper AI(原名Jarvis)是全面的AI写作工具,可生成各种类型文章,包括学术论文。 9. AI Writer:简单易用的学术写作工具工具简介:AI Writer专注于学术写作高质量内容生成,根据关键词或话题自动生成论文段落,适合初稿生成。可快速启动论文写作过程。 上述9AI工具各有特色,不管是初稿生成、内容润色还是语法检查,都可为您的论文写作提供有力支撑。选择合适的工具,让AI成为您学术道路上的得力帮手,轻松应对各种写作挑战。

    52410编辑于 2025-08-07
  • 2026年配音软件技术选型:从腾讯云TTS到三款轻量效率工具

    涵盖API集成与人工操作场景,实测数据与代码示例,助你快速构建配音能力在开发智能语音交互、批量课程配音、开源项目演示等场景时,TTS(文本转语音)是基础能力之一。 2.1腾讯云TTS核心参数指标实测数据首包延迟300–400ms(流式合成)音质评分9/10(神经拟人模型)定价按量计费,低至1.2元/千字(实际以官网为准)免费层新用户有试用额度(具体请参考官方活动) 电影预告”“史诗旁白”“电竞解说”分类附加功能AI写作、音频转文字(导出SRT字幕)、视频转文字、格式转换生成速度约1分钟/次多角色能力手动切换不同音色(分条录制)技术特点无需编程,每日免费额度足够日更在开发流程中的价值 AI写作功能可辅助生成脚本初稿,提高内容产出效率。音色分类清晰,便于在前期选定最合适的voice_type。 免费试用,零成本完成复杂配音场景的效果验证。

    17810编辑于 2026-05-06
领券