首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >调查数据分析(离散数据)

调查数据分析(离散数据)
EN

Data Science用户
提问于 2014-11-14 15:20:44
回答 1查看 342关注 0票数 2

我做了一些小调查,得到了这样的数据:

代码语言:javascript
复制
|-------------| Yes | No | Dont_Know |  
|-------------|     |    |           |  
| Employee    | 60  | 5  | 5         |  
| Workers     | 17  | 0  | 1         |  
| Businessmen | 71  | 5  | 10        |  
| Jobless     | 4   | 30 | 0         |  

R码

代码语言:javascript
复制
dt <- data.frame(workers = c("Employee",
                             "Workers", 
                             "Businessmen", 
                             "Jobless"), 
                 yes = c(60,17,71,4), 
                 no = c(5,0,5,30), 
                 dont_know = c(5,1,10,0)
                )
  1. 如果我想证明失业的人经常选择“没有答案”,我必须做什么样的测试?
  2. 失业和商人之间的差异是否很大?
  3. 其他团体又是什么呢?
  4. 我还能从这些数据中得到什么信息,或者我可以从这些数据中提出什么样的问题?
EN

回答 1

Data Science用户

回答已采纳

发布于 2014-11-15 01:26:16

以下是一些值得尝试的东西。

  1. 绘制条形图。条形图将清楚地显示失业人员经常选择不。试一试单因素方差分析。如果p< delta (即delta=0.05),尝试一个后自组织测试(即Tukey的HSD)来进行两两比较。
  2. 就像我之前说过的,首先尝试一个多个比较测试(单向方差),如果有统计学上的显著差异,你可以尝试一个两两比较测试(后特别测试)。
  3. 或者尝试一种聚类算法?小心,因为边际和(按行或列)是不相等的。或者按行业建立相似矩阵?在我看来,雇员和商人似乎是一个群体(非常相似),而工人和失业者都属于自己的群体。如果你把这些频率转换成比例,那么你可能只有两个组:一个是雇员+工人+商人,另一个是失业者。
  4. 使用应变表分析,看看这些回复(是/否/不知道)是否与职业相关。
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/2469

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档