我应该使用1.5*IQR规则来确定左右尾部的离群值,方法是在一个函数中使用这两个方程:
这就是我迄今尝试过的:
IQR.outliers <- function(x) {
if(any(is.na(x)))
stop("x is missing values")
if(!is.numeric(x))
stop("x is not numeric")
Q3<-quantile(x,0.75)
Q1<-quantile(x,0.25)
IQR<-(Q3-Q1)
left<-x<(Q1-(1.5*IQR))
right<-x>(Q3+(1.5*IQR))
c(left,right)
}
发布于 2018-03-03 23:42:01
目前,您正在得到一个逻辑向量。相反,使用逻辑索引。假设你只想要价值观本身而不是它们的位置,那么:
IQR.outliers <- function(x) {
if(any(is.na(x)))
stop("x is missing values")
if(!is.numeric(x))
stop("x is not numeric")
Q3<-quantile(x,0.75)
Q1<-quantile(x,0.25)
IQR<-(Q3-Q1)
left<- (Q1-(1.5*IQR))
right<- (Q3+(1.5*IQR))
c(x[x <left],x[x>right])
}检查一下它是否给出了合理的结果:
> IQR.outliers (1:100)
integer(0)
> IQR.outliers (c(1:100,1000))
[1] 1000
> IQR.outliers (rnorm(1000) )
[1] -3.522064 -3.296682 2.910200 2.671333https://stackoverflow.com/questions/49090357
复制相似问题