假设我有一个只有一个连续变量的数据集,我尝试使用决策树算法来构建一个模型,该模型从数据集中对+ve和-ve标签进行分类。我运行10折交叉验证。
如何计算决策树分类器的AUC?算法会检查分类器的不同阈值,并确定AUC吗?
如果我有两个以上的连续变量呢?
谢谢!
发布于 2014-03-12 08:41:44
离题,但嘿:
AUC仅对二进制分类有意义。预测器的数量无关紧要。
决策树本身没有“阈值”,但通常在分类问题中,树叶包含两个类别的概率分布,树的预测也是如此。因此,你可以设想,只有当正类的概率是>= p,而不仅仅是>= 0.5时,才会选择它。然后你可以画一条AUC曲线。
因此,将此应用于决策树有点不自然,但可以做到。
https://stackoverflow.com/questions/22338494
复制相似问题