我想知道做语音识别和文本到语音转换的各种技术。另外,请让我知道任何资源,如链接,教程,电子书等在它。
实现这一目标的最有效技术是什么?
发布于 2009-12-23 14:32:02
我将回答有关语音识别的部分(因为我对文本到语音的转换了解不多):
“语音识别的统计方法”这本书是一本经典的书,它解释了统计语音识别的数学基础,由该领域的创始人Frederick Jelinek撰写。
你必须知道的最重要的概念是Hidden Markov Models。几十年来,人们一直在语音识别中使用它们。最近的一种方法使用Conditional Random Fields,请参阅paper (PDF)和相关的软件工具包SCARF。
编写自己的语音识别器是相当困难的。这是一个活跃的研究领域,有几个科学会议,例如ASRU,Interspeech,ICASSP。
发布于 2009-12-24 11:55:03
两者都是非常广泛的领域。关于识别:在本this schema中,您将了解如何构建一个基本的自动语音识别系统。这不是任何接近艺术的开始,但它是可以实现的东西,它工作。如果你想做一些更高级的事情,请阅读倒谱系数和隐马尔可夫模型。看看HTK,它是一个广泛使用的隐马尔可夫模型工具包。
关于text to speech:我会看看Festival。
发布于 2009-12-29 12:42:01
有多个狮身人面像,其中最活跃的是pocketsphinx和sphinx4。
Sphinx4是用Java编写的。它更适合于桌面和web应用程序。
Pocketsphinx是用C语言编写的,它更适合嵌入式设备。有很多iphone/android应用都在使用它。
听起来你想要口袋狮身人面像。试试这个教程:http://www.speech.cs.cmu.edu/sphinx/tutorial.html
更好的地方是在CMU的sourceforge论坛上询问pocketsphinx/Shinx4问题。
此外,您应该提供更多的信息,如您打算使。
至于书籍,语音识别的圣经是“口语处理”。
https://stackoverflow.com/questions/1947717
复制相似问题