我试图使用语音识别库将语音转换为文本。但是当我运行代码时,它显示了有关音频类型的值错误,我试图将文件格式更改为许多音频格式,例如:"PCM、WAV、AIFF、AIFF-C、Mp3、Mp4、FLAC、WebM、wav.“通过重命名文件扩展名。但是,它仍然显示出同样的错误。
错误:
ValueError:音频文件无法读取为PCM、AIFF/AIFF-C或本机FLAC;检查文件是否损坏或以其他格式
“守则”:
import speech_recognition as sr
filename = "hello.mp3"
r = sr.Recognizer()
with sr.AudioFile(filename) as source:
audio = r.record(source)
text = r.recognize_google(audio)
print(text)发布于 2021-04-30 03:03:01
我不认为重命名文件扩展名会有帮助,你应该使用文件转换器,以确保音频数据是正确编码在另一种格式。尝试使用SoundConverter
https://stackoverflow.com/questions/67327588
复制相似问题