我只想知道sklearn.tree.DecisionTreeClassifier用来创建叶节点的标准是什么(以及如何)的细节。我知道参数criterion{“gini”, “entropy”}, default=”gini”和splitter{“best”, “random”}, default=”best”用于拆分节点。但是,我找不到更多关于分割阈值的信息。
叶节点的创建涉及到一些方法:剪枝后(建好树后砍掉树)和预剪枝(通过尝试和提前停止建树过程来防止过度拟合)。了解更多用于拆分的标准的细节,以便更好地理解并能够更多地定制这些模型,这将是非常有用的。
发布于 2020-08-01 03:35:43
预剪枝由多种参数处理:max_depth、min_samples_split、min_samples_leaf、min_weight_fraction_leaf、max_leaf_nodes和min_impurity_decrease.
剪枝后对于滑雪来说是相对较新的。,并以最小的成本-复杂度剪枝,参数ccp_alpha完成.
https://datascience.stackexchange.com/questions/78509
复制相似问题