我对特征选择是个新手,不确定我是否了解如何使用特征选择进行情感分析。尝试使用SelectKBest(f_classif)、SelectKBest(f_regression)、SelectKBest(mutuial_info_classif)和SelectKBest(f_info_regression)来解决分类问题有意义吗?我本以为它不会,只有带有f_classif和mutual_info_classif的SelectKBest。
发布于 2020-10-31 15:39:45
f_classif
ANOVA F-value between label/feature for classification tasks.mutual_info_classif
Mutual information for a discrete target.f_regression
F-value between label/feature for regression tasks.mutual_info_regression
Mutual information for a continuous target.你有一个离散的目标,所以这里没有回归。然而,对于大型数据集,我不会使用基于F-test的特征选择类型,因为它是基于统计测试的,并且对于大型数据集,任何差异都可能在统计上显着,选择性能几乎为零。(但作为任务的一部分,您肯定可以对它们进行比较。)
https://stackoverflow.com/questions/64619425
复制相似问题