首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何实时处理音频?

如何实时处理音频?
EN

Stack Overflow用户
提问于 2013-06-26 15:13:15
回答 4查看 10.8K关注 0票数 7

我有一些通过麦克风输入的音频。我把它录在“奥迪”里,它看上去像下面所示。

我想实时处理这个音频。我主要想做的是:

  1. 见实时音频振幅与时间图。
  2. 根据事件执行一些操作,比如,如果看到一个波形模式类似于某个预定义的波形,然后调用一个函数。 在图像的上半部分,你可以看到四个扰动。我希望每当看到这种干扰时,脚本应该调用一个函数,否则,当信号几乎是直的时候,不要继续分析信号。

是否有任何Python模块或C库允许我这样做?

EN

回答 4

Stack Overflow用户

发布于 2013-07-05 21:18:51

我建议你先把自己介绍给FFT,这样你就可以对音频的实时处理进行大量的分析和控制。

1#一个正向快速傅立叶变换将给你在时域内的振幅,从你的频域(音频数据本身)转换为基于时间/频率范围内的振幅模式的2# -你可以决定调用额外的线程或函数;例如-当你在某个频率箱或时隙上没有振幅时-做一些事情,跳过否则。

有大量的开源C库来对音频数据执行FFT,比如http://aubio.org/https://github.com/zaphire/Monocle-Engine/blob/master/Core/Audio/fft.cpp --还有更多。但一定要让你了解FFT和声音分析之前,你继续。我个人没有使用过这些C库,而是在iOS音频分析方面做了很多工作,但是工作原理应该是相似的。

票数 4
EN

Stack Overflow用户

发布于 2013-07-03 17:56:15

PythonInMusic很可能有你想要的东西,但是很难判断你的目标任务是“基于某些事情执行一些行动”。

票数 0
EN

Stack Overflow用户

发布于 2013-07-05 15:42:14

如果我们在这里说的是语音识别,您可以看看帝王之蝇,它被描述为

Python包,它提供了一个高级对象模型,允许用户轻松地编写使用语音识别的脚本、宏和程序。

脓语

speech.py是一个Python模块,它为的语音识别和文本到语音功能提供了一个干净的接口。这是非常容易使用在一个程序,需要倾听特定的短语或一般的发言,或需要发言。

总之,这两个python模块看起来像处理实时音频,可能会给您一些提示.

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17323972

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档