我想要一个快速离线语音识别器(像vosk或斯芬克斯)作为谷歌语音识别的唤醒词,这样它就不会总是听到我们说的话。
想要唤醒这个词:
def takeCommand():
# mic input
r = sr.Recognizer()
with sr.Microphone() as source:
print("Hearing...")
# r.pause_threshold = 1
r.chunk_size = 2048
r.adjust_for_ambient_noise(source)
audio = r.listen(source)
try:
print("Recognizing....")
query = r.recognize_google(audio, language='en-in')
print(f"You said: {query}\n")
except Exception as e:
print(e)
print("Say that again please...")
return "None"
return query发布于 2022-11-05 20:13:10
沃斯克应该对一个快速唤醒的词很好地工作。选择一个唤醒词/短语,它的语言模式涵盖,不经常出现在正常对话中。然后使用partial回调来返回低延迟匹配。
您可以通过浏览https://ccoreilly.github.io/vosk-browser/并尝试一些基于网络的示例唤醒词来快速了解它的工作效果。
如果您在状态管理中有单独的“清醒”和“睡眠”模式,您可能会非常自由地添加同音词和关闭-足够匹配您的尾随词。例如,如果你的唤醒词是“醒来”,你也可以接受“方式上”和其他短语作为唤醒词。
在大多数平台上,您应该得到亚秒级的匹配,尽管硬件差异可以显着地改变这一点。
https://stackoverflow.com/questions/69173800
复制相似问题