文章/答案/技术大牛

发布

社区首页 >问答首页 >决策树方法用于数据分析的局限性是什么？

问决策树方法用于数据分析的局限性是什么？
EN

Data Science用户

提问于 2017-12-14 12:26:06

回答 2查看 11.3K关注 0票数 4

据我所知，决策树方法用于数据分析的主要局限性是：

少提供有关预测因素与响应之间关系的信息。
倾向于方差或水平更大的预测因子。
可能有高度共线预测的问题。
对于样本容量小的响应，预测精度较差。

还有其他的吗？它们对同质性、正态性、独立性等传统统计假设是否稳健？

decision-trees

machine-learning

classification

random-forest

回答 2

Data Science用户

发布于 2017-12-25 19:26:41

简单决策树在下面列出了一些限制。幸运的是，其中一些可以固定使用集合学习技术(例如打包，增强.)。

关于限制：

树在底部往往很快就会长出来。如果在最后一个节点中几乎没有观察到的数据，那么可能会做出错误的决定。在这种情况下，可以考虑减少树的级别或使用剪枝。
树可能是不稳定的，因为数据中的小变化可能导致生成完全不同的树。
决策树在每个节点上执行贪婪的最佳分割搜索。对于基于CART的实现来说尤其如此，它测试所有可能的拆分。对于连续变量，这表示了2^(n-1) -1与当前节点中的观测数n的可能分裂。
对于分类，如果某些类占主导地位，它可以创建有偏见的树。因此，建议在拟合前平衡数据集。另外，对于决策树，有些发行版可能很难学习。下面是一个例子(XOR)：

票数 5

Data Science用户

发布于 2017-12-20 07:57:49

1)过拟合是决策树模型最实际的难点之一。该问题通过对模型参数设置约束和剪枝来解决。

2)不适合连续变量:在处理连续数值变量时，决策树在对不同类别的变量进行分类时会丢失信息。

票数 3

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/25666

复制

相似问题

问决策树方法用于数据分析的局限性是什么？
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问决策树方法用于数据分析的局限性是什么？EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问决策树方法用于数据分析的局限性是什么？
EN