最近我得到了这样的任务:从给定的短音频文件链中提取诸如F0(基频)、Jitter和Shimmer等特征(大约5-10秒,一个声音在一个音符上唱歌)。而且,不幸的是,我在音频信号处理方面一无是处。任何Python库都可以帮助我轻松快捷地完成它吗?提前谢谢你!
发布于 2019-03-09 18:50:58
您可以使用Praat软件来完成它。Praat是一个用于音频处理的软件。有几个库允许在Python中使用Praat。最好的是Praat-Parselmouth0.3.2,他允许您在Python环境中使用prat。https://pypi.org/project/praat-parselmouth/
发布于 2019-05-24 10:49:38
大家好,还有利布罗萨,很多网上的例子,都用得很好,还有parseImouth,就像禤浩焯说的,还有太特性。我在同一个项目里工作。
发布于 2022-04-14 04:25:18
奥姆尼扎特具有将声音输出转录到包含f0的CSV文件的能力。抖动和抖动并不支持afaik。
https://stackoverflow.com/questions/54457263
复制相似问题