首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >什么是上下文相关的声学建模?

什么是上下文相关的声学建模?
EN

Stack Overflow用户
提问于 2016-05-22 14:56:02
回答 1查看 1.5K关注 0票数 2

我试图弄清楚什么是上下文依赖/依赖声学建模。我一直在试着阅读一些关于它的报纸,但是我对这个概念仍然有些动摇。正如我目前所理解的(这可能是错误的),上下文相关的声学模型是根据在序列中发生音素的数据进行训练的声学模型。例如,用单词对目标语言进行训练,因此音素是由前后发生的音素所决定的,给出了上下文。而独立的语境将是一个声学模型,有些是如何与音素隔离地训练的。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-05-22 17:54:40

传统的方法是使用隐马尔可夫模型(HMM)来识别语音。基本上,在HMM中,您尝试将输入声音表示为一系列的状态。每一种状态对应于音素的某一部分。

区别不在于模型是如何训练的,而在于模型本身的结构。声学模型是一组声音探测器。每个检测器都描述什么声音是相似的,例如,它可能是一个高斯混合模型(GMM),它描述了音素特征的最可能值。也可以是神经网络来检测特定的声音。

在上下文无关的模型中,隐马尔可夫模型的结构简单,只需一个检测器就可以检测出所有的手机事件。说你探测到“嗨”这个词的探测器

代码语言:javascript
复制
 HH_begin HH_middle HH_end IY_begin IY_middle IY_end

你用完全相同的检测器检测单词"hoy“

代码语言:javascript
复制
 HH_begin HH_middle HH_end OY_begin OY_middle OY_end

在上下文相关模型中,HH检测器在"hi“和"hoy”中是不同的,并分别进行训练。基本上,它们有不同数量的参数。这是合理的,因为手机周围确实影响到手机本身的发音,手机的声音开始有点不同。所以你有

代码语言:javascript
复制
 HH_before_IY_begin HH_before_IY_middle 
     HH_before_IY_end IY_after_HH_begin 
        IY_after_HH_middle IY_after_HH_end

还有霍伊

代码语言:javascript
复制
 HH_before_OY_begin HH_before_OY_middle 
     HH_before_OY_end OY_after_HH_begin 
        OY_after_HH_middle OY_after_HH_end

这种方法的优点是,由于你有更多的参数,你可以更准确地识别语音。缺点是你不得不考虑更多的变体。

语音识别算法非常复杂,超出了公共网络通常描述的范围。例如,为了减少检测器的数量,上下文相关的模型通常被聚类并绑定到一些较小的集合中。与数百个可能的上下文相关检测器不同,您只有几千个检测器合并,以提供良好的识别和泛化。

如果你认真对待语音识别算法和实践,而不是网络上的随机源,最好阅读像口语处理这样的教科书,或者至少阅读论文隐马尔可夫模型在语音识别中的应用

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37375865

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档