首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >科学家如何找到正确的隐马尔可夫模型参数和拓扑来使用?

科学家如何找到正确的隐马尔可夫模型参数和拓扑来使用?
EN

Data Science用户
提问于 2015-10-09 00:02:34
回答 2查看 1.2K关注 0票数 10

我理解如何在基因组序列中使用隐马尔可夫模型,例如找到一个基因。但我不明白如何想出一个特定的马尔可夫模型。我是说,这个模型应该有多少个州?有多少种可能的过渡?模型应该有一个循环吗?

他们如何知道他们的模型是最优的?

他们是否想象,比如10个不同的模型,对这10个模型进行基准测试,并发布最好的模型呢?

EN

回答 2

Data Science用户

回答已采纳

发布于 2015-10-09 14:18:23

我熟悉三种主要方法:

  1. 天生的。你可能知道有四个碱基对可以从中挑选,所以允许HMM有四种状态。或者你可能知道英语有44个音素,在语音识别模型中隐藏音素层有44个状态。
  2. 估计。状态数通常可以预先估计,也许可以通过简单的聚类来估计所观察到的HMM特征。如果HMM转移矩阵是三角形的(这通常是故障预测中的情况),那么状态数决定了从开始状态到结束状态的总时间分布的形状。
  3. 优化。正如您所建议的,要么创建和匹配许多模型,然后选择最好的模型。还可以调整学习HMM的方法,允许模型根据需要添加或丢弃状态。
票数 6
EN

Data Science用户

发布于 2015-10-14 22:49:14

另一种方法是从具有可数无限多个状态的模型中抽取样本。对“多少”的答案将出现在平均的样本之上。

http://mlg.eng.cam.ac.uk/zoubin/papers/ihmm.pdf

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/8357

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档