首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >有序数据的离群分析

有序数据的离群分析
EN

Stack Overflow用户
提问于 2014-03-20 17:10:02
回答 1查看 1.7K关注 0票数 1

简言之,我进行了一项满意度调查,要求调查对象以1至7的满意度来回答问题。

下面是数据集中两个变量之间的散射图(抖动)的一个示例(我正在研究R):

https://drive.google.com/uc?export=download&id=0Bx2Sns2vaI9ycm1tV2pNSWUxQXc

因此,我正在调查的数据集是由序号数据构成的,我想对这些数据进行异常值分析。

对于这类数据,您有什么建议作为最佳的离群点分析方法,以及如何在R上实现?

提前谢谢你,

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-03-20 21:26:23

您的数据如下所示:

代码语言:javascript
复制
x = rep(1:7, c(3, 4,17, 21, 48, 118, 93)) 
y = c(
    rep(1:7,c(1,2,0,0,0,0,0)),
    rep(1:7,c(2,0,1,1,0,0,0)),
    rep(1:7,c(10,3,2,1,0,0,1)),
    rep(1:7,c(15,3,1,1,1,0,0)),
    rep(1:7,c(20,10,2,10,3,2,1)),
    rep(1:7,c(40,20,20,30,3,4,1)),
    rep(1:7,c(50,25,10,5,3,0,0))
)

情节:

代码语言:javascript
复制
library(car)
sp(x,y, jitter = list(x=0.8, y=0.8), smoother=F, reg.line = F)

如果您只想知道给定值是否是数据中的异常值(即单变量异常值分析),则可以使用:

代码语言:javascript
复制
library(outliers)
grubbs.test(x)

或者简单地使用boxplot,它的值被绘制为异常值:

代码语言:javascript
复制
boxplot(x, plot=F)$out

如果需要多元异常值,可以使用mvoutlier包(参见函数?chisq.plot?pcout):

代码语言:javascript
复制
library(mvoutlier)
pcout(x=data.frame(x,y))
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/22540327

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档