我有超过20k个特征,3m个对象和超过3k个类的文本分类问题。数据非常稀疏。我在sparseMatrix object中的R.数据矩阵上写的程序。如何在此数据上选择特征?我找到了FSelector包,但它不能与sparseMatrix一起工作,只支持data.frame,而且由于内存限制,我无法转换数据。
发布于 2016-06-22 21:17:37
请看一下:
FSelector:
https://cran.r-project.org/web/packages/FSelector/FSelector.pdf
varSelRF:
https://cran.r-project.org/web/packages/varSelRF/varSelRF.pdf
R、相关矩阵滤波器、PCA和反向选择:
http://www.r-bloggers.com/introduction-to-feature-selection-for-bioinformaticians-using-r-correlation-matrix-filters-pca-backward-selection/
https://stackoverflow.com/questions/37965857
复制相似问题