首页
学习
活动
专区
圈层
工具
发布
首页标签语音合成

#语音合成

拟真高效的文本转语音服务

Interspeech 2023论文速览:语音识别与对话AI技术

用户11764306

语音识别占据主导地位,但某机构的研究还涉及数据表示、对话管理、问答系统等多个领域。

4610

基于语音钓鱼的Aura客户数据泄露机制与防御架构研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着通信技术的演进,网络攻击正从传统的文本钓鱼向更具欺骗性的语音钓鱼(Vishing)形态演变。近期,智能照明品牌Aura遭遇的客户数据泄露事件,揭示了攻击者利...

12610

韩国语音钓鱼案件中资金隐匿机制与检方补充侦查策略研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着信息通信技术的迭代升级,电信网络诈骗犯罪呈现出组织化、智能化及非接触化的显著特征。其中,语音钓鱼(Voice Phishing)作为传统社会工程学攻击的现代...

9410

ICASSP 2022:语音转换与数据增强技术新突破

用户11764306

在《Voice Filter: Few-shot text-to-speech speaker adaptation using voice conversio...

5810

从零搭建一个免费的文本转语音在线工具(基于 Edge TTS)

西门吹雪1997

最近有个需求,需要把一段文字转换成语音,找了几个在线工具,要么收费,要么有水印,要么音质惨不忍睹。后来发现微软 Edge 浏览器的 TTS(Text-to-Sp...

52510

基于注意力机制的更简歌唱合成系统

用户11764306

新系统首次使用基于注意力的序列到序列模型,摒弃了用于处理颤音和音素时长等特征的独立模型。

10410

韩国信用信息服务语音钓鱼攻击机制与防御体系研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

近期,韩国发生了一起针对韩国信用信息服务(Korea Credit Information Service, KCIS)的复杂语音钓鱼(Vishing)攻击事件...

16610

地缘政治危机驱动下的语音钓鱼攻击演化与防御机制研究——以中东局势相关金融诈骗为例

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着国际地缘政治冲突的频发,网络犯罪团伙正迅速调整其社会工程学攻击策略,将宏观时事热点转化为微观欺诈工具。本文以韩国金融当局近期发布的关于“利用中东局势实施语音...

19710

用腾讯云语音,给你的🦞OpenClaw 装上耳朵和嘴巴

腾讯云AI

本文将教你如何为 OpenClaw 接入腾讯云语音识别与语音合成能力,让它真正"能听会说"——配置简单,效果直接,看完就能上手。

3.9K3611

实时交互型钓鱼套件驱动的语音钓鱼攻击机制与防御研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着多因素认证(MFA)技术的广泛部署,传统的凭据窃取攻击面临巨大挑战,迫使网络犯罪团伙转向更具交互性和欺骗性的攻击手段。近期,身份管理厂商Okta披露了一种新...

25910

基于稳定币场外交易的语音钓鱼资金清洗机制与链上溯源研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着区块链技术的普及与去中心化金融(DeFi)生态的演进,加密货币已深度嵌入全球支付与价值转移体系。然而,其匿名性、跨境流通的便捷性以及监管套利的空间,使其逐渐...

18310

分享一个专利: 一种在吃鸡游戏中模仿历史胜利玩家打法并对当前玩家进行打法推荐的方案

amc

这是笔者之前撰写的一篇专利的技术交底书。现在这份专利已经处于公开阶段,可以免费查阅。不过经常写专利的同学都知道,正式的专利文本往往是很难直接看懂的。于是我在咨询...

55982

韩国强制语音钓鱼赔偿政策的道德风险与防御博弈分析

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着电信网络诈骗手段的日益智能化与心理化,全球各国政府纷纷探索强化金融机构责任的监管路径。韩国政府拟议的强制性语音钓鱼(Voice Phishing)受害者赔偿...

15610

TTS模型共存的可扩展框架

用户11764306

像Alexa这样的语音智能体通常拥有多种不同的语音合成器,它们在表现力、个性、语言和说话风格等属性上各不相同。支撑这些不同应用的机器学习模型可能具有完全不同的架...

9000

大模型应用:TTA文本驱动音频:MusicGen大模型参数调优+音频情绪可视化.23

未闻花名

随着语音大模型的普及,不管是TTS还是ASR,都与音频处理有着紧密的联系,AIGC的蓬勃发展,也催生了文本到音频(Text-to-Audio, TTA)的落地场...

38321

大模型应用:一文读懂TTS技术应用:基础入门到实战的全场景指南.18

未闻花名

在人工智能与语音交互技术飞速发展的今天,TTS(Text-to-Speech,文本转语音)已渗透到生活与工作的方方面面。从手机导航的语音播报、智能音箱的对话反馈...

32121

Qwen3-TTS 架构解析:基于 LLM 的自回归语音生成

buzzfrog

各位同学,在大模型(LLM)席卷 NLP 领域的今天,语音合成(Text-to-Speech, TTS)技术也正经历着一场范式转移(Paradigm Shift...

56710

深入解析 MeloTTS:中文 TTS Pipeline 与多音字修正实战

buzzfrog

MeloTTS 是一个基于 VITS2 架构的高质量、多语言 TTS(文本转语音)系统,以其极快的推理速度和自然的韵律表现著称。虽然它在多语言支持上表现优异,但...

24010
领券