我正在寻找R包或机器学习模型/算法,如randomForest、glmnet、gbdt等,它们可以处理NA,而不是忽略有NA实例的行或列。有什么建议吗?
发布于 2011-12-11 08:04:24
CART算法相当无缝地处理NA (rpart包)。然后,您可以随时使用rpart转向bagged trees,可能是通过ipred包。
我听说多元自适应回归样条( mda包中的mars)可以很好地处理丢失的数据,尽管我对它没有太多经验。
此外,可以修改k近邻模型(以及更一般的内核方法,我认为),以相当简单的方式处理缺失值,但实现可能无法做到这一点。但大概就像调整距离度量一样简单,只考虑成对完成的情况。我不太熟悉特定的R包,它们比普通的knn模型做得更多。
https://stackoverflow.com/questions/8460638
复制相似问题