文章/答案/技术大牛

发布

社区首页 >问答首页 >语音识别

问语音识别
EN

Stack Overflow用户

提问于 2016-06-20 08:19:28

回答 1查看 1.7K关注 0票数 4

我有一个java应用程序。我想在上面实现一个语音识别功能。

就像这样：

假设我有一些用户称之为“嘿”、“1”、“2”、"tea“的记录，当他/她说”嘿“时，语音识别api应该识别这些记录的第一个输入。”嘿“、”1“、”2“、"tea”可以是英语中没有词的东西。

我已经找到了一些apis，这些apis支持语音识别或有听觉打印算法。但我不想用它们。

让我解释一下为什么我不使用这些apis。首先，语音识别apis试图理解单词并转换为文本。但是，这仅限于api支持的语言。即使语音识别api支持英语语言。因为用户发音不好，结果可能会很糟糕。所以我不想在我的应用程序中使用语音识别api。因为特性不应该是基于语言的。

此外，当我寻找一个语音识别api时，我发现了“音频打印”api。我使用过"musicg“api，它是开源的。然后，我开发了一个测试应用程序。应用程序记录4个不同的音频文件，其中包含unword声音。在此之后，我录制了一个与其中一个类似的声音，测试api将最后一个声音与以前使用musicg的音频文件进行了比较。然而，结果也非常糟糕。

正如我前面提到的，我需要一个语音识别功能，就像旧手机一样。

voice-recognition

voice

musicg

java

speech-recognition

回答 1

Stack Overflow用户

发布于 2017-11-29 19:09:09

查看kaldi http://kaldi-asr.org/或本tensorflow教程：recognition

在这两种情况下，你可以训练模型，它不是基于语言的。你可以训练一些特定的声音或口音，或一些特定的背景。

另外，也许这个项目会对你产生影响：https://github.com/cmusphinx/g2p-seq2seq --它不使用语言模型，而是将音频翻译成音素。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/37917589

复制

相似问题

问语音识别
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问语音识别EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问语音识别
EN