我正在使用Weka并应用J48来构建我的分类器。我有40个特性和2000个实例(700个a类和1300个b类)。
J48决策树只使用了40个特性中的2个!是否有任何方式允许J48使用所有功能,或者是否有任何其他算法允许使用所有功能?
提前谢谢。
发布于 2013-02-07 02:23:04
也许是因为J48不需要更多的属性。
您可以在Select attribute选项卡中检查特征的相关性,并使用Ranker作为搜索方法,Principal Components作为赋值器来运行选择器。它将向您显示每个功能和每个类之间的关系,还将告诉您哪些功能最能描述您的类。
发布于 2013-02-06 23:46:55
分类并不需要所有的40个特征。因为一些特征可能是冗余的(例如,相关的)或者不包含歧视信息。
您可以在Weka Explorer的Select attributes选项卡中运行feature selection之前,查看哪些功能是重要的。
您还可以测试SVM (libSVM或SMO)、Neural Network ( MultilayerPerceptron)和/或Random Forest等分类器,因为它们通常会给出最佳的分类结果(取决于问题)。
https://stackoverflow.com/questions/14617009
复制相似问题