我正在测试一个回归任务的不同模型。在使用OLS、Ridge和Lasso时,我使用了不同的多项式度的解释变量。例子:对于两个变量x和y,2级给出了解释变量x,x^2,xy,y,y^2。
然而,在使用决策树时,我不确定使用任何高于1的度作为解释变量是否有意义。示例:在应用决策树回归器时,测试x^2、xy和y^2是否有意义?
我问的原因是,决策树回归是一个非线性回归。一方面,这可能是一个争论,它没有意义,包括高阶多项式,因为十项树已经可以处理非线性。
发布于 2020-01-20 13:20:47
由于CART(分类和回归树)是一种非参数算法,它们应该能够发现变量与非线性行为之间的交互作用。
然而,建立多项式可以帮助他们有一个更好的性能。
https://datascience.stackexchange.com/questions/66764
复制相似问题