问调查数据分析(离散数据)
EN

Data Science用户

提问于 2014-11-14 15:20:44

回答 1查看 342关注 0票数 2

我做了一些小调查，得到了这样的数据：

|-------------| Yes | No | Dont_Know |  
|-------------|     |    |           |  
| Employee    | 60  | 5  | 5         |  
| Workers     | 17  | 0  | 1         |  
| Businessmen | 71  | 5  | 10        |  
| Jobless     | 4   | 30 | 0         |

R码

dt <- data.frame(workers = c("Employee",
                             "Workers", 
                             "Businessmen", 
                             "Jobless"), 
                 yes = c(60,17,71,4), 
                 no = c(5,0,5,30), 
                 dont_know = c(5,1,10,0)
                )

如果我想证明失业的人经常选择“没有答案”，我必须做什么样的测试？
失业和商人之间的差异是否很大？
其他团体又是什么呢？
我还能从这些数据中得到什么信息，或者我可以从这些数据中提出什么样的问题？

回答 1

Data Science用户

回答已采纳

发布于 2014-11-15 01:26:16

以下是一些值得尝试的东西。

绘制条形图。条形图将清楚地显示失业人员经常选择不。试一试单因素方差分析。如果p< delta (即delta=0.05)，尝试一个后自组织测试(即Tukey的HSD)来进行两两比较。
就像我之前说过的，首先尝试一个多个比较测试(单向方差)，如果有统计学上的显著差异，你可以尝试一个两两比较测试(后特别测试)。
或者尝试一种聚类算法？小心，因为边际和(按行或列)是不相等的。或者按行业建立相似矩阵？在我看来，雇员和商人似乎是一个群体(非常相似)，而工人和失业者都属于自己的群体。如果你把这些频率转换成比例，那么你可能只有两个组:一个是雇员+工人+商人，另一个是失业者。
使用应变表分析，看看这些回复(是/否/不知道)是否与职业相关。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/2469

复制

相似问题

问调查数据分析(离散数据)
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问调查数据分析(离散数据)EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问调查数据分析(离散数据)
EN