首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >帧语音识别的上下文窗口

帧语音识别的上下文窗口
EN

Stack Overflow用户
提问于 2017-07-04 16:28:07
回答 1查看 682关注 0票数 1

在许多语音识别论文中,我看到了“框架上下文窗口”这一术语。我不确定这一点,但看起来你从话语中提取了一帧x,然后将这一帧与5个之前的帧和5个未来的帧连接起来。并且该上下文窗口的标签是中心框架。我说的对吗?

谢谢

(顺便说一句,数字5只是一个例子)

EN

回答 1

Stack Overflow用户

发布于 2017-07-04 22:08:58

是的,这个术语从深度神经网络(DNN)在自动语音识别中的应用开始流行起来。例如,"11帧声学上下文窗口“意味着将5个前一帧和5个未来帧的特征向量连接到当前帧的向量。但是标签仍然是中心框架的标签。使用上下文窗口提高了DNN模型的性能,但不是以前使用的HMM(隐马尔可夫模型)。

有关更多信息,请参阅this文章。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44900802

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档