音频 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签音频

#音频

教练！我的数字滤波器响应怎么一拱一拱的？（周末学习版～）

云深无际 15分钟前2026-07-27 20:37:10

因为现在使用的芯片没有内置的滤波器，还是怀念一下内置滤波器的 ADC；其实去年也写了不少滤波器的内容，但是功力不如今年啊！那这些内容就再拉出来溜溜，今天研究一个...

000

QQ音乐转换成MP3格式的8种方法：轻松实现跨设备畅听

用户12652872 6小时前2026-07-27 14:36:46

相信音乐爱好者都对QQ音乐不陌生，作为主流音乐平台之一，它为用户提供了丰富的曲库和高品质的听觉享受。然而，有些小伙伴就发现了，从QQ音乐平台下载的歌曲多为加密格...

410

FLUX 3dev发布超越seedance 2.0 生图视频音频抢先体验链接

疯狂的KK 3天前2026-07-24 20:10:33

就在今天凌晨黑森林Black Forest Labs正式发布了FLUX 3，这次的模型发布分为多个版本，综合的在开源版本成了一个新的多模态基础模型，生图...

20910

音频处理中降噪、压缩和格式选择的技术原理——以Audacity为例

PC电脑医生 3天前2026-07-24 11:06:05

做音频处理时，有几个操作几乎每次都会用到：降噪、动态压缩、格式导出。大多数教程只讲操作步骤——"点这个按钮、调那个参数"——但很少解释这些参数背后的信号处理逻辑...

9510

XMOS推出搭载先进AI人声处理的VocalFusion XVF3620

用户12522030 5天前2026-07-22 15:19:31

● 核心功能包含AI降噪、带残余回声滤波的全双工声学回声消除、双麦克风波束成形以及自动增益控制。

5210

Python 将文本内容转换为语音播放并保存为音频文件

用户11081884 7天前2026-07-20 18:51:36

以下代码定义了一个函数 text_to_speech_and_save，该函数读取指定文本文件的内容，通过语音播放，并保存为音频文件。支持调节语速（范围：-10...

6610

IMA，这样用，为知识发声

用户11081884 7天前2026-07-20 17:12:44

在IMA首页对话框上传知识，要求IMA支持的文件格式。选择“生成播客”后生成对应知识的双人自然对话播客。IMA按照信息处理、脚本生成、音频生成的步骤对知识进行处...

15310

爆了，已获8.5K star ！轻量小巧的开源录屏神器来了！

OpenNiuma 7天前2026-07-20 14:08:05

原生支持系统音频回录，不用安装虚拟音频驱动，同步收录系统音效与人声讲解，音画同步延迟控制在毫秒区间，适配网课、游戏、线上会议录制。

15210

阿里出手！效果炸裂！不再忍受即梦排队之痛！AI 短剧神器欢乐马“HappyHorse”重磅上线免费使用

OpenNiuma 7天前2026-07-20 13:39:19

榜单数据相当硬气：在无音频的文生视频赛道，HappyHorse Elo得分约1330+，领先Seedance 2.0超过100分；图生视频同样断层第一。仅在带音...

26210

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

杜金房 10天前2026-07-17 20:22:33

本文档涵盖 mod_audio_stream，这是一个 FreeSWITCH 模块，用于从活动通话信道捕获音频，并通过 WebSocket 或 TCP 连接将其...

10410

Google Gemma 4：把多模态、推理和端侧效率塞进一套模型

唐国梁Tommy 10天前2026-07-17 20:15:46

音频路径更直接：16kHz 原始音频按 40ms 切片，每段形成 640 维向量，然后直接投影进语言模型。论文的意思并不是“模型不再需要任何前处理”，而是不再依...

13910

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

Amusi 10天前2026-07-17 10:49:41

本文介绍了武汉大学行为理解与视觉感知实验室（HUVPR-Lab）在ECCV2026上发表的研究成果。该工作针对以人为中心的音视频联合生成中长期存在的"语音-音...

8410

从lx-music看Electron应用的插件化架构设计：音源模块的解耦与动态加载

PC电脑医生 12天前2026-07-15 11:00:58

在桌面端跨平台应用开发中，Electron凭借前端技术栈 + Node.js能力的组合，成为不少开源项目的首选方案。lx-music-desktop（洛雪音乐助...

11210

webrtc v4.2.16 最新发布：音频封装增强、多轨 OGG 写入上线、ICE 与 DTLS 新增上下文启动能力、依赖全面升级与稳定性修复

福大大架构师每日一题 13天前2026-07-14 16:03:44

对于很多项目来说，实时音频只是链路的一部分，另一部分是落盘、转存、归档或者后处理。以前如果在音轨标签信息方面支持不足，就可能需要额外处理，而现在这一能力已经进入...

19110

别再把长PDF硬塞给聊天框了，用这个免费工具更稳

袁锐钦 14天前2026-07-13 20:10:46

把你指定的资料变成一个「只根据这些材料说话」的研究助手，还能直接出音频概览、报告、测验、信息图一类成品。

8900

视频推理框架进展I

用户10637292 14天前2026-07-13 18:45:17

摘要：近年来，测试时间优化的进步使得大模型（LLM）在推理能力方面取得了显著的提升，使它们能够解决数学和编码方面高度复杂的问题。然而，多模式大模型（MLLM）的...

9310

video-use：Agent 剪视频的关键，不是“看视频”，而是“读视频”

唐斩 16天前2026-07-11 09:31:31

第一层是音频转写。每个词都有时间戳，停顿、口误、重复、笑声、掌声都会变成可读信号。对口播、访谈、教程这类内容来说，剪辑的主要决策本来就来自语言节奏。

13810

影石Mic Air x TRAE 无线麦「Vibe Coding 版」来了！这设计，老罗看了都想当场退役

不惑

腾讯云TDP ｜产品KOL (已认证)

17天前2026-07-10 20:30:29

但在TRAE联名版里播放的时候,联名版的音频明显更干净。后来我才知道，联名版在软件层面加了一层AI音频增强处理。它会在转写之前对音频做一次预处理,去除底噪、压缩...

13700

HappyHorse 是谁家的，这个问题今天炸了全球AI圈

不惑

腾讯云TDP ｜产品KOL (已认证)

17天前2026-07-10 20:21:00

有一个小细节要说清楚，加了音频之后情况有变化。加入音频维度，Seedance 2.0 反超 HappyHorse 拿到第一，差距是有音频文生视频赛道 14 分，...

14700

写作和思考，应该被AI改变么？

程序新视界 17天前2026-07-10 18:23:22

随后，在阅读的过程中，整理了一些文章中表达视角不同或理解错误（音频转换导致的）的词句，一篇完全是自己思想的表达，由自己口述，由AI整理的文章就成稿了，没有错别字...

7710

#音频

教练！我的数字滤波器响应怎么一拱一拱的？（周末学习版～）

QQ音乐转换成MP3格式的8种方法：轻松实现跨设备畅听

FLUX 3dev发布超越seedance 2.0 生图视频音频抢先体验链接

音频处理中降噪、压缩和格式选择的技术原理——以Audacity为例

XMOS推出搭载先进AI人声处理的VocalFusion XVF3620

Python 将文本内容转换为语音播放并保存为音频文件

IMA，这样用，为知识发声

爆了，已获8.5K star ！轻量小巧的开源录屏神器来了！

阿里出手！效果炸裂！不再忍受即梦排队之痛！AI 短剧神器欢乐马“HappyHorse”重磅上线免费使用

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

Google Gemma 4：把多模态、推理和端侧效率塞进一套模型

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

从lx-music看Electron应用的插件化架构设计：音源模块的解耦与动态加载

webrtc v4.2.16 最新发布：音频封装增强、多轨 OGG 写入上线、ICE 与 DTLS 新增上下文启动能力、依赖全面升级与稳定性修复

别再把长PDF硬塞给聊天框了，用这个免费工具更稳

视频推理框架进展I

video-use：Agent 剪视频的关键，不是“看视频”，而是“读视频”

影石Mic Air x TRAE 无线麦「Vibe Coding 版」来了！这设计，老罗看了都想当场退役

HappyHorse 是谁家的，这个问题今天炸了全球AI圈

写作和思考，应该被AI改变么？

热门专栏

腾讯开源的专栏

进击的Coder

贤羽的前端小栈

张善友的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#音频

教练！我的数字滤波器响应怎么一拱一拱的？（周末学习版～）

QQ音乐转换成MP3格式的8种方法：轻松实现跨设备畅听

FLUX 3dev发布 超越seedance 2.0 生图 视频 音频 抢先体验链接

音频处理中降噪、压缩和格式选择的技术原理——以Audacity为例

XMOS推出搭载先进AI人声处理的VocalFusion XVF3620

Python 将文本内容转换为语音播放并保存为音频文件

IMA，这样用，为知识发声

爆了，已获8.5K star ！轻量小巧的开源录屏神器来了！

阿里出手！效果炸裂！不再忍受即梦排队之痛！AI 短剧神器欢乐马“HappyHorse”重磅上线免费使用

完整FreeSWITCH语音处理模块mod_audio_stream技术实现细节分享

Google Gemma 4：把多模态、推理和端侧效率塞进一套模型

ECCV 2026 | 武大提出Unison：统一的音视频协同生成框架

从lx-music看Electron应用的插件化架构设计：音源模块的解耦与动态加载

webrtc v4.2.16 最新发布：音频封装增强、多轨 OGG 写入上线、ICE 与 DTLS 新增上下文启动能力、依赖全面升级与稳定性修复

别再把长PDF硬塞给聊天框了，用这个免费工具更稳

视频推理框架进展I

video-use：Agent 剪视频的关键，不是“看视频”，而是“读视频”

影石Mic Air x TRAE 无线麦「Vibe Coding 版」来了！这设计，老罗看了都想当场退役

HappyHorse 是谁家的，这个问题今天炸了全球AI圈

写作和思考，应该被AI改变么？

腾讯开源的专栏

进击的Coder

贤羽的前端小栈

张善友的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

FLUX 3dev发布超越seedance 2.0 生图视频音频抢先体验链接