首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何提高沃森语言的文本准确性?

如何提高沃森语言的文本准确性?
EN

Stack Overflow用户
提问于 2017-07-28 23:01:53
回答 1查看 1K关注 0票数 3

据我所知,沃森对文本的演讲在某种程度上是为口语对话和1到2位发言者校准的。我也知道它能比WAV和OGG更好地处理FLAC。

我想知道如何改进算法识别,从声学上讲。

我是说,增加音量有帮助吗?或者用压缩过滤器?降噪?

什么样的预处理可以帮助这项服务?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-07-31 13:51:54

提高基本模型(非常精确但也非常通用)的准确性的最佳方法是使用沃森STT定制服务:https://www.ibm.com/watson/developercloud/doc/speech-to-text/custom.html。这将使您能够创建一个定制模型,定制您的领域的具体情况。如果你的领域不是很好地匹配那些捕捉到的基础模型,那么你可以期待一个很大的提高识别精度。

“我也知道它能比WAV和OGG更好地处理FLAC”,但事实并非如此。沃森STT服务提供了对flac、wav、ogg和其他格式的完全支持(请参阅本文档的本节:https://www.ibm.com/watson/developercloud/doc/speech-to-text/input.html#formats)。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45383521

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档