首页
学习
活动
专区
圈层
工具
发布
首页标签语音合成

#语音合成

拟真高效的文本转语音服务

OpenClaw TTS 语音合成详解:让 AI 助手开口说话

七夜zippoe

语音交互是人机交互最自然的方式之一,而文本转语音(Text-to-Speech,TTS)技术则是实现语音交互的核心能力。OpenClaw 作为新一代 AI Ag...

100

做短视频解说时,我踩过最严重的AI配音坑

摇摆的风

尤其影视解说、悬疑旁白、小说推文这种内容,一旦AI配音节奏不对,观众前几秒就会直接划走。

100

从轻量试听到API生产:2026常见AI配音方案整理

摇摆的风

最近在做短视频自动旁白和小说推文生成时,重新整理了一遍目前常见的中文TTS(文本转语音)方案。

5910

金融反诈新利器:AI语音合成检测如何保护客户财产安全

gavin1024

金融行业正面临AI语音诈骗的严峻挑战。不法分子利用AI合成技术伪造客户亲友或银行客服的声音实施诈骗,传统的身份验证手段在AI换声面前形同虚设。腾讯云AMS的AI...

19010

直播虾 LiveClaw:“能说会做”的新一代AI虚拟直播

腾讯云音视频

腾讯 | 行业应用产品经理 (已认证)

LiveClaw的整体链路可总结为:观众消息(IM 插件 / 消息回调)→OpenClaw Agent(理解意图 / 调度 Skill)→Skill 执行(点歌...

26020

跨学科交叉:语音识别与合成的联合训练

用户11764306

语音合成与语音识别模型的循环训练,以及为了更好语音韵律而进行的语言理解,仅仅是语音相关领域交叉融合的几个例子。

7610

有字幕,没配音?用浏览器自带语音能力,让网页视频直接“开口说话”

桑榆肖物

如果还想继续往停顿、重音、局部语速、角色风格这些更细的维度走,那就不得不提一下 Azure 语音合成服务的SSML1。它本质上是一套基于 XML 的语音合成标记...

24010

语音合成中的韵律建模新方法

用户11764306

在ICASSP 2021上,某机构的文本到语音团队展示了两篇关于从文本合成具有上下文恰当韵律(即语音的节奏、重音、旋律、时长和响度)的语音的新论文。文本到语音(...

17410

从自回归到掩码生成:拆解零样本 TTS 在长视频配音场景下的技术路径

用户12383947

做过短剧出海或者影视译配的工程师大概都遇到过这样一个场景:拿一段十分钟的中文剧情,翻译成英文之后用一个看起来效果不错的 TTS 模型合成配音,前两分钟听起来非常...

19510

语音钓鱼(Vishing)统计特征、技术机理与全链路防御研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

语音钓鱼(Vishing)依托号码仿冒、AI 语音克隆与实时社会工程学交互,已成为 2025—2026 年全球增长最快的网络攻击形式之一。SQ Magazine...

17810

跨部门协同治理下语音钓鱼防控效能提升与技术实现研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

本文以韩国政府跨部门电信金融诈骗综合应对小组成立半年来的治理实践为研究样本,结合警方公开数据与技术防控机制,系统分析语音钓鱼案件数量下降 31.6%、涉案损失下...

18010
领券