首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >训练HMM -所需的数据量

训练HMM -所需的数据量
EN

Stack Overflow用户
提问于 2015-01-24 18:26:21
回答 1查看 1.2K关注 0票数 0

我正在使用HMM进行分类。我在维基百科的Baum–Welch algorithm示例中遇到了一个示例。希望有人能帮我。

这个例子如下:“假设我们有一只鸡,我们每天中午从鸡身上收集鸡蛋。现在,鸡是否下蛋取决于一些隐藏的未知因素。然而,为了简单起见,我们可以假设只有两种状态来决定鸡是否下蛋。”

请注意,在本例中,我们有两个不同的观察值(N和E)和两个状态(S1和S2)。

我的问题是:

我们需要多少个观察/观察序列(或训练数据)才能最好地训练模型。有没有办法估计或测试所需的训练数据量。

EN

回答 1

Stack Overflow用户

发布于 2015-01-24 20:24:26

对于HMM模型中的每个变量,您需要大约10个样本。使用这个经验法则,你可以很容易地计算出需要多少样本才能构建一个可靠的分类器。在您的示例中,您有两个状态,这两个状态的结果是2进2转移矩阵A=a_00,a_01;a_10,a_11,其中a_ij是从状态S_i到S_j的转移概率。

此外,这些概率为p_S1和p_S2的状态中的每一个都会生成观察结果,即:如果我们处于概率为p_S1的状态S1,鸡将下蛋,而概率为1-p_S1的鸡将不会下蛋。总共有6个变量需要估计。很明显,仅从两个观察值来准确估计它们是不可能的。正如我之前提到的,通常假设每个变量至少需要10个样本才能准确估计该变量。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28124490

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档