文章/答案/技术大牛

发布

社区首页 >问答首页 >成本复杂性剪枝:修剪错误

问成本复杂性剪枝:修剪错误
EN

Stack Overflow用户

提问于 2018-03-07 18:45:30

回答 1查看 703关注 0票数 3

有谁能解释一下这两种说法：

在成本复杂性剪枝中，剪枝树的错误永远不能小于训练数据集中的原始树。

在成本复杂性剪枝中，剪枝树错误永远不能少于验证数据集中的原始树。

第一条陈述是对的，第二条是错误的。

machine-learning

pruning

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-03-07 20:11:41

对于您选择的任何剪枝策略，这都是正确的，前提是构建原始树是为了最小化训练集中的错误。

True:剪枝树错误永远不能少于训练数据集中的原始树。

原始树是尽可能特定的，通过用叶节点替换子树，您只能得到一个不那么特定的树。因此，训练数据中的误差要么保持不变，要么增加，永不减少。

假:剪枝树错误永远不能少于验证数据集中的原始树。

我们假设验证集是未知的，并且独立于训练数据集。所以，一般情况下，你不能做任何这样的假设。在剪枝时，验证数据集上的错误可能会增加、保持不变或减少。

但是，我们预计错误会减少，因为树将变得不那么特定于培训数据，因此更有可能与不同的数据集兼容。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/49159179

复制

相似问题

问成本复杂性剪枝:修剪错误
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问成本复杂性剪枝:修剪错误EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问成本复杂性剪枝:修剪错误
EN