首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >NAs的聚合结果为0,而不是NAs

NAs的聚合结果为0,而不是NAs
EN

Stack Overflow用户
提问于 2017-07-25 05:46:53
回答 3查看 49关注 0票数 2

我试图在一个数据帧中找出三个不同变量的总和,同时按另一个变量分组,但有几个NAs。NAs的总和被解释为零而不是NA。下面是一个示例:

代码语言:javascript
复制
my_data <- data.frame(Month = c("1995-01-01", "1995-01-01", "1995-01-01",
                            "1995-02-01", "1995-02-01"),
                  Value_1 = c(1, NA, 2, NA, NA),
                  Value_2 = c(2, 2, 3, NA, 1),
                  Value_3 = c(NA, NA, NA, NA, NA))

#summing through dplyr
my_data %>%
  group_by(Month) %>%
  summarise_each(funs(sum(.,na.rm = TRUE)))

#summing through base R
my_vars = c("Value_1", "Value_2", "Value_3")
aggregate(x = my_data[my_vars], by = my_data["Month"], FUN = sum, 
na.rm = TRUE) 

例如,对于这两个月的Value_3,我得到的和是零而不是NA。任何关于如何对NAs求和以获得NA而不是零的建议都将受到极大的感谢。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2017-07-25 05:55:09

根据您自己的方法,添加ifelse

代码语言:javascript
复制
my_data %>%
    group_by(Month) %>%
    summarise_each(funs(ifelse(sum(is.na(.))==length(.),NA,sum(.,na.rm = TRUE))))
票数 2
EN

Stack Overflow用户

发布于 2017-07-25 05:52:55

如果变量中的所有值都是NA,则可以添加if/else返回NA:

代码语言:javascript
复制
my_data %>% 
    group_by(Month) %>% 
    summarise_all(
        funs(if(all(is.na(.))) NA else sum(., na.rm = TRUE))
    )

# A tibble: 2 x 4
#       Month Value_1 Value_2 Value_3
#      <fctr>   <dbl>   <dbl>   <lgl>
#1 1995-01-01       3       7      NA
#2 1995-02-01      NA       1      NA
票数 4
EN

Stack Overflow用户

发布于 2017-07-25 09:45:32

我们也可以使用以下命令来完成此操作

代码语言:javascript
复制
library(data.table)
setDT(my_data)[, lapply(.SD, function(x)  sum(x, na.rm = TRUE) *NA^(all(is.na(x)))), Month]
#       Month Value_1 Value_2 Value_3
#1: 1995-01-01       3       7      NA
#2: 1995-02-01      NA       1      NA
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45290612

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档