文章/答案/技术大牛

发布

社区首页 >问答首页 >科学家如何找到正确的隐马尔可夫模型参数和拓扑来使用？

问科学家如何找到正确的隐马尔可夫模型参数和拓扑来使用？
EN

Data Science用户

提问于 2015-10-09 00:02:34

回答 2查看 1.2K关注 0票数 10

我理解如何在基因组序列中使用隐马尔可夫模型，例如找到一个基因。但我不明白如何想出一个特定的马尔可夫模型。我是说，这个模型应该有多少个州？有多少种可能的过渡？模型应该有一个循环吗？

他们如何知道他们的模型是最优的？

他们是否想象，比如10个不同的模型，对这10个模型进行基准测试，并发布最好的模型呢？

machine-learning

model-selection

hyperparameter

markov

回答 2

Data Science用户

回答已采纳

发布于 2015-10-09 14:18:23

我熟悉三种主要方法：

天生的。你可能知道有四个碱基对可以从中挑选，所以允许HMM有四种状态。或者你可能知道英语有44个音素，在语音识别模型中隐藏音素层有44个状态。
估计。状态数通常可以预先估计，也许可以通过简单的聚类来估计所观察到的HMM特征。如果HMM转移矩阵是三角形的(这通常是故障预测中的情况)，那么状态数决定了从开始状态到结束状态的总时间分布的形状。
优化。正如您所建议的，要么创建和匹配许多模型，然后选择最好的模型。还可以调整学习HMM的方法，允许模型根据需要添加或丢弃状态。

票数 6

Data Science用户

发布于 2015-10-14 22:49:14

另一种方法是从具有可数无限多个状态的模型中抽取样本。对“多少”的答案将出现在平均的样本之上。

http://mlg.eng.cam.ac.uk/zoubin/papers/ihmm.pdf

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/8357

复制

相似问题

问科学家如何找到正确的隐马尔可夫模型参数和拓扑来使用？
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问科学家如何找到正确的隐马尔可夫模型参数和拓扑来使用？EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问科学家如何找到正确的隐马尔可夫模型参数和拓扑来使用？
EN