在R中,如何生成带有异常值的向量(数据)?如果数据是“可接受的”正态分布的话,那就太棒了。
发布于 2013-09-18 21:21:32
这实际上取决于“离群点”的定义;
c(rnorm(100), 100, -100) # an egregious example
plot(density( c( rnorm(90), rnorm(5, 1) ) ) ) # not as egregious发布于 2013-09-18 21:32:51
@DWin是对的,这取决于你所说的“离群点”是什么意思。为了记录在案,我使用的定义与他使用的定义相同,因此我会使用(已经使用)类似于他和@Ferdinand.kraft列表的代码。其他的有时意味着一个比你通常所发现的更极端的基准。对于模拟研究来说,这是很难定义的,但是一个通用的定义是一个点超过1(3)四分位数的四分位数范围的1.5倍以上。这里有一个简单的方法可以找到这一点(我相信会有更有效的方法):
flag <- 0
while(flag==0){
X <- rnorm(N)
bp <- boxplot(X, plot=FALSE)
if(length(bp$out)!=0){
flag <- 1
}
}https://stackoverflow.com/questions/18881724
复制相似问题