我对WEKA非常陌生,我有一个带有109 attributes的111 cases数据集。我在WEKA中使用了特性选择选项卡,CfsSubsetEval和BestFirst search method用于feature selection。我正在使用leave-one-out cross-validation。
那么,WEKA选择了多少个特征,或者这个方法在交叉验证的每一步中选择的特征数的停止标准是什么?
谢谢,
戈皮
发布于 2017-09-24 07:14:19
CfsSubsetEval算法正在搜索一个特征子集,这些特征可以很好地结合在一起(特征之间的相关性很低,与目标标签的相关性很高)。子集的分数称为优点(您可以在输出中看到它)。
BestFirst搜索不允许您确定要选择的功能的数量。但是,您可以使用其他方法,如GreedyStepWise或使用InformationGain/GainRatio算法和Ranker,并定义特征集的大小。
可以用来影响集合大小的另一个选项是搜索的方向(向前、向后.)。
祝好运
https://stackoverflow.com/questions/46373229
复制相似问题