假设我有一些非常长的音频文件(例如,无线电录音)。我需要提取5秒后,特定的声音(例如,广告开始声音)从每个文件。每个文件可能包含3-5这样的声音,所以我应该得到*(3-5)源文件的结果文件。
我找到了利布罗萨和枕骨 python库,但不确定它们是否能提供帮助。我该从什么开始?
发布于 2018-10-04 19:09:55
您可以从计算信号与特定声音的相关性开始。不确定利布罗萨是否会提供这个。我会从scipy.signal.correlate或scipy.signal.convolve开始。
不知道你的背景。如果您需要一些理论,请启动这里。
基本上,如果音频与您的特定信号相匹配或与其非常相似,则相关性将很高。在确定这些位置之后,您可以选择它们周围的一个区域。
https://stackoverflow.com/questions/52653371
相似问题