文章/答案/技术大牛

发布

社区首页 >问答首页 >用于二值分类的特征集排序

问用于二值分类的特征集排序
EN

Data Science用户

提问于 2020-12-15 09:34:51

回答 1查看 39关注 0票数 1

我有一些特征集，比如X1和X2 .每个特征集都有一些可变的特征，并且不同的特征集之间没有交集，比如X1有100个特性，X2有500个特性，而且它们都没有相同的特性。尽管从其中提取这些特征的文件对于x1和x2都是相同的。

每个特征集可以单独用于二进制分类。像X1一样，也可以用于分类，X2也可以用于分类。它们也可以结合使用，例如X1 U X2，它将有600个特性。

但是我想比较这些特征集，因此我想知道是否有任何统计方法可以用来对这些特征集进行排序，而不是分类精度。

就像X1比X2好等等.

machine-learning

statistics

feature-selection

ranking

回答 1

Data Science用户

发布于 2020-12-15 12:25:36

您可以使用一些统计方法对这些特征集进行排序，例如在每个特征集中提取一个判别分数(科莫戈罗夫、互信息、.)然后取平均值，中值，p95，.

但是，取决于将要使用的分类器，这个分数可能是无用的，因为一些分类器充当特征选择器(决策树、神经网络、.)而另一些则不是(高斯NB，kNN，.)。

示例

如果你在你的500中有10个很好的特征来区分你的分类和其他490不包含信息。使用基于决策树的分类器将获得良好的性能，因为可能只使用这10个特征。kNN在另一方面会导致不好的表现.

但是，您的功能设置评分将保持不变。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/86706

复制

相似问题

问用于二值分类的特征集排序
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于二值分类的特征集排序EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于二值分类的特征集排序
EN