首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在C++中实现语音识别和文语转换?

如何在C++中实现语音识别和文语转换?
EN

Stack Overflow用户
提问于 2009-12-23 01:00:57
回答 6查看 11.9K关注 0票数 12

我想知道做语音识别和文本到语音转换的各种技术。另外,请让我知道任何资源,如链接,教程,电子书等在它。

实现这一目标的最有效技术是什么?

EN

回答 6

Stack Overflow用户

回答已采纳

发布于 2009-12-23 14:32:02

我将回答有关语音识别的部分(因为我对文本到语音的转换了解不多):

http://ecx.images-amazon.com/images/I/4190SZC61CL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg

“语音识别的统计方法”这本书是一本经典的书,它解释了统计语音识别的数学基础,由该领域的创始人Frederick Jelinek撰写。

你必须知道的最重要的概念是Hidden Markov Models。几十年来,人们一直在语音识别中使用它们。最近的一种方法使用Conditional Random Fields,请参阅paper (PDF)和相关的软件工具包SCARF

编写自己的语音识别器是相当困难的。这是一个活跃的研究领域,有几个科学会议,例如ASRUInterspeechICASSP

票数 8
EN

Stack Overflow用户

发布于 2009-12-24 11:55:03

两者都是非常广泛的领域。关于识别:在本this schema中,您将了解如何构建一个基本的自动语音识别系统。这不是任何接近艺术的开始,但它是可以实现的东西,它工作。如果你想做一些更高级的事情,请阅读倒谱系数和隐马尔可夫模型。看看HTK,它是一个广泛使用的隐马尔可夫模型工具包。

关于text to speech:我会看看Festival

票数 6
EN

Stack Overflow用户

发布于 2009-12-29 12:42:01

有多个狮身人面像,其中最活跃的是pocketsphinx和sphinx4。

Sphinx4是用Java编写的。它更适合于桌面和web应用程序。

Pocketsphinx是用C语言编写的,它更适合嵌入式设备。有很多iphone/android应用都在使用它。

听起来你想要口袋狮身人面像。试试这个教程:http://www.speech.cs.cmu.edu/sphinx/tutorial.html

更好的地方是在CMU的sourceforge论坛上询问pocketsphinx/Shinx4问题。

此外,您应该提供更多的信息,如您打算使。

至于书籍,语音识别的圣经是“口语处理”。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1947717

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档