我有一个有17个变量的数据集,它们都是整数/num。为了进行更好的描述性分析,我创建了这个用户定义的函数:
sum <- function(x)
{
na.len<-sum(is.na(x))
mean<-mean(x,na.rm=T)
sd<-sd(x,na.rm=T)
min<-min(x,na.rm=T)
q1<-quantile(x,0.25,na.rm=T)
q3<-quantile(x,0.75,na.rm=T)
max<-max(x,na.rm=T)
UC1=mean+3*sd
LC1=mean-3*sd
UC2=quantile(x,0.99,na.rm=T)
LC2=quantile(x,0.01,na.rm=T)
iqr=IQR(x,na.rm=T)
UC3=q3+1.5*iqr
LC3=q1-1.5*iqr
ot<-max>UC1 | min<LC1 | max>UC2 | min<LC2 | max>UC3 | min<LC3
x[x>max]<-max
x[x<min]<-min
out_exist <- ifelse(noofNA > 0, "outlier_exists", "")
return(c(noofNA=na.len,mean=mean,std=sd,min=min,q1=q1,q3=q3,max=max,outlier=ot, out_exists= out_exist))
}当我在dataset上使用此函数时,使用:
apply(df, 2, sum)我得到以下错误:
错误:计算嵌套太深:无限递归/选项(expressions=)?包装过程中的错误:计算嵌套太深:无限递归/选项(expressions=)?
我想弄清楚到底是怎么回事,但都是徒劳的,请帮帮忙!
发布于 2015-10-23 10:45:54
这就是您的函数应该看起来的样子。但是您没有定义noofNA,所以仍然会得到一个错误。
details <- function(x)
{
na.len <- sum(is.na(x))
m <- mean(x, na.rm=TRUE)
s <- sd(x, na.rm=TRUE)
mn <- min(x, na.rm=TRUE)
q1 <- quantile(x, 0.25, na.rm=TRUE)
q3 <- quantile(x, 0.75, na.rm=TRUE)
mx <- max(x, na.rm=TRUE)
UC1 <- m+3*s
LC1 <- m-3*s
UC2 <- quantile(x, 0.99, na.rm=TRUE)
LC2 <- quantile(x, 0.01, na.rm=TRUE)
iqr <- IQR(x, na.rm=TRUE)
UC3 <- q3+1.5*iqr
LC3 <- q1-1.5*iqr
ot <- mx>UC1 | mn<LC1 | mx>UC2 | mn<LC2 | mx>UC3 | mn<LC3
x[x>mx]<-mx
x[x<mn]<-mn
out_exist <- ifelse(noofNA > 0, "outlier_exists", "")
return(list(noofNA=na.len, mean=m, std=s, min=mn, q1=q1, q3=q3, max=mx, outlier=ot, out_exists= out_exist))
}
set.seed(123)
df1 <- data.frame(x = rnorm(100), y = rnorm(100))
sapply(df1, details)https://stackoverflow.com/questions/33299560
复制相似问题