语音 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签语音

#语音

分裂团伙卧底反噬语音钓鱼黑产链条攻防与治理研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

12小时前2026-07-25 20:19:15

跨境语音钓鱼（Vishing）犯罪已形成多层级、分工明确的产业化黑产网络，团伙内部利益冲突、分支分裂催生 “卧底反水、黑吃黑” 新型内部对抗模式。韩国中央日报披...

800

深度解读：多模态测试的5大常见误区

顾翔 1天前2026-07-24 10:58:45

引言随着AIGC、智能座舱、具身智能机器人等技术爆发式发展，多模态AI系统（融合文本、图像、语音、视频、传感器信号等多源输入与输出）正加速落地。然而，传统软件...

5210

线下资金车手视角下 AI 语音钓鱼全链路风险与智能检测防御研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

2天前2026-07-23 09:31:01

本文以 2026 年 7 月韩国 SBS 曝光的出租车司机识破语音钓鱼取现车手、协助警方抓获涉案人员案件为核心实证样本，系统拆解 AI 语音钓鱼黑产分层组织架构...

9410

Voicebox：把 ElevenLabs 和 WisprFlow 合二为一的开源 AI 语音工作室

勇哥AI笔记 4天前2026-07-21 16:30:51

Voicebox 不训练新模型，它的核心价值是：把多个开源语音模型集成到一个统一的桌面应用中，覆盖"语音克隆 + 语音合成 + 口述输入 + Agent 语音输...

10710

Voicebox：把 ElevenLabs 和 WisprFlow 装进一个本地 App，44k Star 开源语音工作室拆解

阿特拉斯 4天前2026-07-21 16:02:20

ElevenLabs 把语音合成做到了行业标杆，WisprFlow 把语音听写做成了生产力工具。这两家云厂商正好卡在语音 I/O 回路的两端——一个管输出，一个...

13810

OpenAI 官方新手指南：从零开始用 ChatGPT

阿特拉斯 5天前2026-07-21 09:07:36

这份指南很短，但把新手最需要的几件事都串起来了：ChatGPT 到底是什么、第一句话该怎么发、什么样的任务适合先用起来、语音怎么用，以及下一步该去上哪门课。下面...

17710

Python 将文本内容转换为语音播放并保存为音频文件

用户11081884 5天前2026-07-20 18:51:36

文本转语音（Text-to-Speech, TTS）技术能够将书面文字转换为自然语音输出，广泛应用于辅助阅读、语言学习、无障碍服务等场景。Python py...

6410

IMA，这样用，为知识发声

用户11081884 5天前2026-07-20 17:12:44

IMA能存、能搜、能读、能写，能做数据分析和专业领域的AI知识库，越用越懂你。现在IMA支持生成双人自然对话播客，把知识发给IMA，它会自动生成普通话语音直接播...

14010

IMA，这样用，创作更容易了

用户11081884 5天前2026-07-20 17:10:51

在ima移动端的首页可以通过语音来输入问题，ima根据语音的输入帮助快速进行问答，创作等。

13800

干翻豆包！装上 OpenClaw 安卓端 + Claude 大模型，让老旧手机变身超级 AI 助手, 别让它再躺抽屉换不锈钢盆了

OpenNiuma 5天前2026-07-20 13:45:58

安卓端支持连续语音模式，加上 ElevenLabs 的 TTS 语音输出能力，让旧手机变成一个随身携带的语音交互终端。走在路上直接跟手机对话，让 AI 帮忙查资...

9210

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

杜金房 8天前2026-07-17 20:22:33

本文档涵盖 mod_audio_stream，这是一个 FreeSWITCH 模块，用于从活动通话信道捕获音频，并通过 WebSocket 或 TCP 连接将其...

10010

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

Amusi 8天前2026-07-17 10:49:41

本文介绍了武汉大学行为理解与视觉感知实验室（HUVPR-Lab）在ECCV2026上发表的研究成果。该工作针对以人为中心的音视频联合生成中长期存在的"语音-音...

7910

别再裸面了，搭个 AI 面试官先练一轮

王中阳AI编程 10天前2026-07-15 12:55:37

我没用豆包的语音功能——豆包模型不太行。方案是：龙虾 + 讯飞输入法语音输入。讯飞的语音识别准确率很高，技术术语识别也没问题。效果和豆包原生语音差不多，但模型用...

16310

视频推理框架进展I

用户10637292 12天前2026-07-13 18:45:17

摘要：近年来，测试时间优化的进步使得大模型（LLM）在推理能力方面取得了显著的提升，使它们能够解决数学和编码方面高度复杂的问题。然而，多模式大模型（MLLM）的...

9310

【AI Agent展】思必驰天琴语音助手——新一代智能座舱人机对话系统

数据猿 12天前2026-07-13 15:28:38

天琴语音助手是思必驰自主研发的新一代智能座舱人机对话系统，专为车载场景打造。产品基于思必驰自研的全栈对话式AI技术体系和“1+N”大模型智能体架构，融合车控、导...

19010

伪造 Microsoft Entra 通行密钥注册的语音钓鱼攻击研究

芦笛

中国互联网络信息中心｜工程师 (已认证)

14天前2026-07-12 07:56:12

针对 2026 年 4 月以来 O-UNC-066 威胁组织发起的新型语音钓鱼（Vishing）攻击，本文深入剖析其伪造 Microsoft Entra 通行密...

12610

#语音

分裂团伙卧底反噬语音钓鱼黑产链条攻防与治理研究

深度解读：多模态测试的5大常见误区

线下资金车手视角下 AI 语音钓鱼全链路风险与智能检测防御研究

Voicebox：把 ElevenLabs 和 WisprFlow 合二为一的开源 AI 语音工作室

Voicebox：把 ElevenLabs 和 WisprFlow 装进一个本地 App，44k Star 开源语音工作室拆解

OpenAI 官方新手指南：从零开始用 ChatGPT

Python 将文本内容转换为语音播放并保存为音频文件

IMA，这样用，为知识发声

IMA，这样用，创作更容易了

干翻豆包！装上 OpenClaw 安卓端 + Claude 大模型，让老旧手机变身超级 AI 助手, 别让它再躺抽屉换不锈钢盆了

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

别再裸面了，搭个 AI 面试官先练一轮

视频推理框架进展I

【AI Agent展】思必驰天琴语音助手——新一代智能座舱人机对话系统

伪造 Microsoft Entra 通行密钥注册的语音钓鱼攻击研究

热门专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

张善友的专栏

TEG云端专业号的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐