首页
学习
活动
专区
圈层
工具
发布
首页标签语音识别

#语音识别

专业智能高效的语音处理服务

跨学科交叉:语音识别与合成的联合训练

用户11764306

语音合成与语音识别模型的循环训练,以及为了更好语音韵律而进行的语言理解,仅仅是语音相关领域交叉融合的几个例子。

6310

Alexa对话AI的技术进展与创新

用户11764306

准确的远场自动语音识别(ASR)对于与 Alexa 的自然交互至关重要。继续在这一领域取得进展,在 Interspeech 2020 上,展示了12篇论文,包括...

8310

人工智能之语音领域 语音处理 第六章 语音处理技术发展趋势与未来展望

咚咚王

尽管语音处理技术取得了显著进展,但在复杂场景下的表现仍有待提升。远场语音识别、高噪音环境、多人同时说话等场景下,识别准确率仍然面临挑战。这些场景中,语音信号容易...

21510

人工智能之语音领域 语音处理 第五章 语音处理实践落地与常见问题解决

咚咚王

Hugging Face Transformers:提供wav2vec 2.0、Whisper、VITS等预训练模型

14500

网络钓鱼攻击特征识别与多维度防御技术研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

网络钓鱼是当前最普遍、危害最突出的网络安全威胁类型,攻击者依托伪造邮件、短信、社交信息与虚假网站,结合社会工程学手段诱导用户泄露敏感数据或执行恶意操作,对个人信...

33410

人工智能之语音领域 语音处理 第四章 语音与文本、图像的多模态融合应用

咚咚王

多模态融合是指将语音、文本、图像三种不同模态的信息进行整合、互补,利用各模态的优势,提升模型的性能和应用场景的适配能力。其中,语音提供听觉信息,文本提供语义信息...

12510

语音钓鱼(Vishing)统计特征、技术机理与全链路防御研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

语音钓鱼(Vishing)依托号码仿冒、AI 语音克隆与实时社会工程学交互,已成为 2025—2026 年全球增长最快的网络攻击形式之一。SQ Magazine...

15010

人工智能之语音领域 语音处理 第二章 语音处理核心技术

咚咚王

ASR、TTS和声纹识别作为语音处理的三大核心技术,各自拥有完整的技术体系和应用场景。通过深入理解其核心技术流程、性能影响因素和主流模型演进,可以更好地设计和优...

20310

跨部门协同治理下语音钓鱼防控效能提升与技术实现研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

本文以韩国政府跨部门电信金融诈骗综合应对小组成立半年来的治理实践为研究样本,结合警方公开数据与技术防控机制,系统分析语音钓鱼案件数量下降 31.6%、涉案损失下...

16210

人工智能之语音领域 语音处理 第一章 语音处理基础入门

咚咚王

语音处理是一门融合信号处理、计算机科学、语言学、声学等多学科的技术,核心是对语音信号进行采集、分析、转换、合成、识别等操作,实现"机器听懂语音""机器说出语音"...

13110

认知偏差与防御失效:AI 时代员工钓鱼识别能力困境与重构

芦笛

中国互联网络信息中心 | 工程师 (已认证)

Darktrace 于 2026 年 3 月发布的调研数据显示,80% 的美国职场员工对自身识别钓鱼邮件的能力充满自信,但在真实场景测试中仅 32% 能够准确识...

19110

一款强大的音视频转字幕工具,完全免费、无广告!

多多神器

下载models.zip模型,将压缩包解压至主程序根目录models文件夹之下,如:D:\CapsWriter-Offline-Windows-64bit\mo...

900

基于语音钓鱼的Aura客户数据泄露机制与防御架构研究

芦笛

中国互联网络信息中心 | 工程师 (已认证)

随着通信技术的演进,网络攻击正从传统的文本钓鱼向更具欺骗性的语音钓鱼(Vishing)形态演变。近期,智能照明品牌Aura遭遇的客户数据泄露事件,揭示了攻击者利...

17610
领券