SPSS与C&RT、C5.0和CHAID一起实现了QUEST。相对来说,探索在教科书中很少涉及--与其他决策树算法相比,它的优缺点是什么?它是如何分裂的?为什么它(显然)不像C&RT或C5.0那样被广泛使用?
发布于 2016-06-28 07:00:52
QUEST代表快速、公正和高效的统计树。
它使用方差分析F和列联表卡方检验来选择变量进行分裂。将具有多个类的变量合并到两个超类中,得到用二次判别分析( QDA )确定的二值分裂。使用CART算法可以对树进行修剪。它既可用于分类任务,也可用于回归任务。
Quest首先通过将判别坐标分配给预测器的类别,将范畴(符号)变量转换为连续变量。然后应用二次判别分析(QDA)确定分割点。注意,QDA通常会产生两个断点--选择一个更接近第一个超类的样本平均值的点。
任务树算法的一个优点是,它在分裂变量的选择中没有偏倚,不像CART倾向于选择允许更多分裂的分裂变量,以及那些有更多缺失值的变量。
不知道为什么不像CART或C5.0那样广泛地使用它。这可能是由于CART/C5.0在文献中的覆盖面比其他文献大。
参考文献:
https://datascience.stackexchange.com/questions/12449
复制相似问题