首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >范畴变量分析

范畴变量分析
EN

Data Science用户
提问于 2022-01-04 15:51:22
回答 1查看 107关注 0票数 0

我的数据集由一个数值变量(称为"N4")和几个影响数值变量的分类变量组成。例如,有一个名为"die“的分类变量,如果它等于"alpha”,那么N4的值大约为100,如果它等于"beta“,那么N4的值大约为300。

我的目标是找出哪些类别变量对我的数值变量影响最大。

将分类变量转化为数值变量并计算相关性是否有意义?还有其他更有效的分析吗?

EN

回答 1

Data Science用户

回答已采纳

发布于 2022-07-27 21:00:14

您可以使用以下不同的方法:

  1. 点-双列相关:测量连续变量和二分变量之间的强度和关联。
  2. 方差分析:检验哪些范畴变量与连续变量有显著关系(p值最少的变量最显着)。然后使用两两比较检验和置信区间来检查哪对组不同。
  3. Kruskal检验:非参数性与方差分析相似,不假定正态性.
票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/106696

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档