文章/答案/技术大牛

发布

社区首页 >问答首页 >如何实时处理音频？

问如何实时处理音频？
EN

Stack Overflow用户

提问于 2013-06-26 15:13:15

回答 4查看 10.8K关注 0票数 7

我有一些通过麦克风输入的音频。我把它录在“奥迪”里，它看上去像下面所示。

我想实时处理这个音频。我主要想做的是：

见实时音频振幅与时间图。
根据事件执行一些操作，比如，如果看到一个波形模式类似于某个预定义的波形，然后调用一个函数。在图像的上半部分，你可以看到四个扰动。我希望每当看到这种干扰时，脚本应该调用一个函数，否则，当信号几乎是直的时候，不要继续分析信号。

是否有任何Python模块或C库允许我这样做？

audio

signal-processing

回答 4

Stack Overflow用户

发布于 2013-07-05 21:18:51

我建议你先把自己介绍给FFT，这样你就可以对音频的实时处理进行大量的分析和控制。

1#一个正向快速傅立叶变换将给你在时域内的振幅，从你的频域(音频数据本身)转换为基于时间/频率范围内的振幅模式的2# -你可以决定调用额外的线程或函数；例如-当你在某个频率箱或时隙上没有振幅时-做一些事情，跳过否则。

有大量的开源C库来对音频数据执行FFT，比如http://aubio.org/或https://github.com/zaphire/Monocle-Engine/blob/master/Core/Audio/fft.cpp --还有更多。但一定要让你了解FFT和声音分析之前，你继续。我个人没有使用过这些C库，而是在iOS音频分析方面做了很多工作，但是工作原理应该是相似的。

票数 4

Stack Overflow用户

发布于 2013-07-03 17:56:15

PythonInMusic很可能有你想要的东西，但是很难判断你的目标任务是“基于某些事情执行一些行动”。

票数 0

Stack Overflow用户

发布于 2013-07-05 15:42:14

如果我们在这里说的是语音识别，您可以看看帝王之蝇，它被描述为

Python包，它提供了一个高级对象模型，允许用户轻松地编写使用语音识别的脚本、宏和程序。

或脓语

speech.py是一个Python模块，它为的语音识别和文本到语音功能提供了一个干净的接口。这是非常容易使用在一个程序，需要倾听特定的短语或一般的发言，或需要发言。

总之，这两个python模块看起来像处理实时音频，可能会给您一些提示.

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/17323972

复制

相似问题

问如何实时处理音频？
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何实时处理音频？EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何实时处理音频？
EN