我有一个数据框架
df=data.frame(a=1:5,b=c(1,3,4,-999999,4))并想要计算它的平均值,但想要导出异常值,在本例中是-9999。
是否有类似于
na.rm这样我就可以走了
apply(df,1,function(x) mean(if x>-100 & x <100))请注意,我的df如果600 x 50 dim
发布于 2016-06-17 11:37:44
如果你想要整个数据帧的平均值,你可以切入到追逐和使用:
mean(df[df > -100 & df < 100])当我把它应用到你给出的df时,我得到了预期的答案: 3。
发布于 2016-06-17 11:21:56
我们可以根据逻辑条件对'df‘中的值进行replace,并使用rowMeans。
rowMeans(replace(df, !(df < 100 & df > -100) , NA), na.rm=TRUE)
#[1] 1.0 2.5 3.5 4.0 4.5或评论中提到的@RHertel
rowMeans(replace(df, abs(df) > 100 , NA), na.rm=TRUE)
#[1] 1.0 2.5 3.5 4.0 4.5或者另一种选择是循环遍历'df‘的列,使用boxplot.stats获取异常值观察,将异常值转换为NA并执行rowMeans。
rowMeans(sapply(df, function(x) x*NA^(x %in% boxplot.stats(x)$out)), na.rm=TRUE)
#[1] 1.0 2.5 3.5 4.0 4.5发布于 2016-06-17 11:48:49
您编写自己的函数(不包括-9999值)。
y<-function(x){mean(x[!grepl("\\-999",x)])}
y(df$b)
[1] 3https://stackoverflow.com/questions/37880215
复制相似问题