文章/答案/技术大牛

发布

社区首页 >问答首页 >训练HMM -所需的数据量

问训练HMM -所需的数据量
EN

Stack Overflow用户

提问于 2015-01-24 18:26:21

回答 1查看 1.2K关注 0票数 0

我正在使用HMM进行分类。我在维基百科的Baum–Welch algorithm示例中遇到了一个示例。希望有人能帮我。

这个例子如下：“假设我们有一只鸡，我们每天中午从鸡身上收集鸡蛋。现在，鸡是否下蛋取决于一些隐藏的未知因素。然而，为了简单起见，我们可以假设只有两种状态来决定鸡是否下蛋。”

请注意，在本例中，我们有两个不同的观察值(N和E)和两个状态(S1和S2)。

我的问题是：

我们需要多少个观察/观察序列(或训练数据)才能最好地训练模型。有没有办法估计或测试所需的训练数据量。

computer-vision

hidden-markov-models

matlab

validation

回答 1

Stack Overflow用户

发布于 2015-01-24 20:24:26

对于HMM模型中的每个变量，您需要大约10个样本。使用这个经验法则，你可以很容易地计算出需要多少样本才能构建一个可靠的分类器。在您的示例中，您有两个状态，这两个状态的结果是2进2转移矩阵A=a_00，a_01;a_10，a_11，其中a_ij是从状态S_i到S_j的转移概率。

此外，这些概率为p_S1和p_S2的状态中的每一个都会生成观察结果，即:如果我们处于概率为p_S1的状态S1，鸡将下蛋，而概率为1-p_S1的鸡将不会下蛋。总共有6个变量需要估计。很明显，仅从两个观察值来准确估计它们是不可能的。正如我之前提到的，通常假设每个变量至少需要10个样本才能准确估计该变量。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/28124490

复制

相似问题

问训练HMM -所需的数据量
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问训练HMM -所需的数据量EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问训练HMM -所需的数据量
EN