首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >X-平方测试:好的,用于选择重要的特征?

X-平方测试:好的,用于选择重要的特征?
EN

Data Science用户
提问于 2021-02-08 12:54:13
回答 1查看 66关注 0票数 0

我将就应急表及其结果提出一个问题。我对以符号作为可能特性的名称进行了这种分析,得到了以下值:

代码语言:javascript
复制
Label          0.0  1.0     
with_symb      1584 241
without_symb     16 14

得到一个p值,让met得出变量是相关的(因为它小于0.05)。我的问题是,这个结果是否可能是一个好的结果,基于x-平方检验,所以,如果我可以包括在模型中。我选择个别的特征,以进入模型的基础上的气平方。也许还有另一种方法可以为模型选择最合适和最重要的特性。任何有关这方面的建议都会很好。

EN

回答 1

Data Science用户

回答已采纳

发布于 2021-02-08 16:48:00

如果您选择基于chi-2测试的特性,我将提出几个可能出现的问题。

  1. 重复使用chi-2测试会导致错误的结果,除非您对运行它的次数进行更正。
  2. 您可以包含相互关联的特性,即。A与B相关,两者与标签相关。不确定,但我认为,这可能会导致结果,当模型表现更差,更多的功能。

我试着从所有的特性开始,删除那些线性相关的特性。但这只是个建议。

此外,可以使用相互信息来估计任何给定的特征对标签的描述程度。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/89112

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档