首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用于语音识别的Vosk-api python。类似谷歌的语音改编功能?

用于语音识别的Vosk-api python。类似谷歌的语音改编功能?
EN

Stack Overflow用户
提问于 2020-08-14 11:06:53
回答 1查看 3.8K关注 0票数 4

因此,Vosk-api是一个出色的离线语音识别器,它提供了出色的支持,但是在这篇文章(2020年8月14日)中,文档非常糟糕(或者隐藏得非常巧妙)。

问题是:是否有任何替代的google-speech-recognizer功能,允许额外的语音适应的转录改善?

例如。

代码语言:javascript
复制
"config": {
    "encoding":"LINEAR16",
    "sampleRateHertz": 8000,
    "languageCode":"en-US",
    "speechContexts": [{
      "phrases": ["weather"]
    }]
}

对于Google来说,这个配置意味着这个短语相对于来说将有更大的优先权,这听起来也是一样的。

或者是等级代币?我知道它可能不是在Vosk中为python3实现的,但是.

以下是参考资料:

https://cloud.google.com/speech-to-text/docs/class-tokens

https://cloud.google.com/speech-to-text/docs/speech-adaptation

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-08-14 19:36:47

有关Vosk模型适应的信息,请参阅本文档:

https://alphacephei.com/vosk/adaptation

基本上有四个层次:

  1. 需要识别的单词列表更新小模型
  2. 更新小模型离线使用文本中的语言模型
  3. 更新语言模型和字典在大模型里面
  4. 细声根据数据建立模型

这个过程不是完全自动化的,但是您可以在小组中寻求帮助。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63411574

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档