我使用R中的FSelector软件包在R中进行了信息增益特征选择。
install.packages("RWekajars")
install.packages("FSelector")
library(FSelector)
weights <- information.gain(Classname~., df)
Attributes attr_importance
X.1 3.6349780
X 3.6349780
Value_1 3.7128973
Value_1 0.9652070
Item_1 2.0845525现在,我需要基于attr_importance.从中选择最好的特性如何根据阈值选择R中最优的特征,以及如何设置阈值?
发布于 2017-11-10 12:52:53
有一个方法cutoff.k来自包FSelector,它解决了您的问题:
results <- cutoff.k.percent(weights, 0.9)将返回所有属性,直到达到0.9为止。或者:results <- cutoff.k(weights, 2)将返回信息增益最多的两个属性。这能解决你的问题吗?
https://stackoverflow.com/questions/41468730
复制相似问题