我正在尝试分析电影内容,并想对电影的视频文件运行语音识别程序。首先,我需要从电影中提取音频,但我似乎找不到最好的方法来做到这一点。有许多库可以帮助分析.wav和.mp3文件,但是有没有一个库可以从视频中提取音频,而不是将其保存到中间音频文件中(可能直接将其作为振幅数组读取以进行分析)?
我使用的是Python,但是里面的任何包都会很有帮助。
发布于 2016-02-02 22:39:24
您可以使用ffmpeg。你可以从python中调用它。
查看此处:subprocess-call-ffmpeg-command-line
然后,在分析音频文件之前,您可以临时写入它。
https://stackoverflow.com/questions/35144907
相似问题