我需要一些关于这个想法的建议,这是我在一个UNI项目中得到的。
我想知道是否有可能将一个音频文件从不同的音频源分成不同的“流”。例如,将音频文件拆分为:发动机噪声、火车噪声、声音、不同的声音,这些声音并不总是存在,等等。
我不一定需要使用编程语言(尽管这是理想的),但也可以通过使用一些声音处理软件(如sound Forge )手动完成。不过,我需要先知道这是否可能。我对声音处理一无所知。
在第一阶段完成后(分离声音),我想确定其中一个处理过的声音是否存在于另一个录音中。其目的将是声音检测。举个(理想的)例子,将汽车引擎的声音与另一个文件进行匹配,确定音频是否是汽车引擎的录音。它不需要那么精确,我猜检测到一个不稳定的声音,比如按喇叭!也没问题。
我会做的编程部分,我只是需要一些关于寻找(软件,数学等)的指针。由于我不是声音专家,如果可能的话,这将是一个非常有趣的项目。
谢谢。
发布于 2018-07-16 03:21:28
这种基于源的声音分割问题在研究中称为(音频)源分离或音频信号分离。如果没有更多关于声源或声源如何混合的信息,这是盲源分离问题。关于这些主题的论文有数百篇。
然而,为了声音检测的目的,通常不需要在音频级分离声音。通常,人们可以(也将)对混合信号上计算的特征进行检测。搜索有关声学事件检测和声学事件分类的文献。
有关该主题的介绍,请参阅Computational Analysis of Sound Scenes and Events之类的书籍
发布于 2014-03-31 22:15:50
从单个音频流中进行自动源分离是非常困难的()。你的大脑非常擅长这项工作,而且它也得益于立体声信号。
例如。声音充满了信号,而这些信号并不总是存在的。汽车噪声具有相当稳定的分量,但齿轮变化是异常值。
不幸的是,没有简单的答案。
发布于 2016-03-31 20:12:42
将参考信号与音频流相关。使用FFT可以有效地完成关联。可以对相关计算的输出进行阈值处理,并及时对信号进行去抖动,以便识别信号。
https://stackoverflow.com/questions/22763887
复制相似问题