基本上,我在Python中有一个语音识别软件,它完美无缺地工作,然后我的驱动器失效了,我不得不购买一个新的,重新安装Windows,重新安装Python (相同版本),以及pip install voskimport SetLogLevel as vosk_log_level
File "C:\Users\james\AppData\Local\Programs\Python\Python310\lib\site-packages\vosk\__init__.py", line 4, in <module>
randomfrom difflib import SequenceMatcherimport sounddevice as sd print("Please download a model for your language from https://alphacephei.com/voskprovides a float:
args.samplerate
使用一个与Vosk存储库中的test_ffmpeg.py非常相似的文件,我正在探索从音频文件中可以获得哪些文本信息。 下面是我正在使用的整个脚本的代码。 #!/usr/bin/env python3
import sysimportif not os.path.exists("model"):
print ("Please download the model f
当我试图使用我自己的音频文件运行test_ffmpeg.py时,它实际上并没有显示所有的翻译。但它只显示了最后一段/批。比如,我的音频文件是这样的:The quick brown fox jumps over the lazy catThe quick brown fox jumps over the lazy bat
会发生的是,它会闪现所有这些文本,它们看起来像预期的那样被翻译出来,但是在脚本的末尾,它只显示了,