文章/答案/技术大牛

发布

社区首页 >问答首页 >如何提高沃森语言的文本准确性？

问如何提高沃森语言的文本准确性？
EN

Stack Overflow用户

提问于 2017-07-28 23:01:53

回答 1查看 1K关注 0票数 3

据我所知，沃森对文本的演讲在某种程度上是为口语对话和1到2位发言者校准的。我也知道它能比WAV和OGG更好地处理FLAC。

我想知道如何改进算法识别，从声学上讲。

我是说，增加音量有帮助吗？或者用压缩过滤器？降噪？

什么样的预处理可以帮助这项服务？

ibm-cloud

speech-recognition

speech-to-text

watson

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-07-31 13:51:54

提高基本模型(非常精确但也非常通用)的准确性的最佳方法是使用沃森STT定制服务：https://www.ibm.com/watson/developercloud/doc/speech-to-text/custom.html。这将使您能够创建一个定制模型，定制您的领域的具体情况。如果你的领域不是很好地匹配那些捕捉到的基础模型，那么你可以期待一个很大的提高识别精度。

“我也知道它能比WAV和OGG更好地处理FLAC”，但事实并非如此。沃森STT服务提供了对flac、wav、ogg和其他格式的完全支持(请参阅本文档的本节：https://www.ibm.com/watson/developercloud/doc/speech-to-text/input.html#formats)。

票数 4

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/45383521

复制

相似问题

问如何提高沃森语言的文本准确性？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何提高沃森语言的文本准确性？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何提高沃森语言的文本准确性？
EN