基本上,我有一个数据,看起来是这样的:
Community Pop_Total Median_Age Under_5 5-9 10-14 15-19 20-24
Akutan city NA NA NA NA NA NA 71
Alcan Border NA NA 2 NA NA NA NA
Alcan Border NA NA NA NA NA 2 NA
Alcan Border NA NA NA NA 5 NA NA
Ambler City 224 NA NA NA NA NA NA
Ambler City NA NA NA 17 NA NA NA是否有一种基于多列数据组合多行的简单方法?我已经看到了一些脚本,这些脚本说您可以基于一个或两个数据列在一个列中组合一个重复的变量,但是我需要更大的规模(我有大约400行的重复项和~30列(而且每个列都有一个大名)。
理想的情况是:
Community Pop_Total Median_Age Under_5 5-9 10-14 15-19 20-24
Akutan city NA NA NA NA NA NA 71
Alcan Border NA NA 2 NA 5 2 NA
Ambler City 224 NA NA 17 NA NA NA我是新来的R.谢谢!
编辑-我使用了以下代码,但是很多列数据(在第一个重复的社区名称之后的数据行消失了: 10-14和15-19的Alcon边框值变成NA)在我折叠它时丢失了。想法?
library(dplyr)
census8 <- census7 %>%
group_by(Community) %>%
summarise_each(funs(sum))发布于 2017-05-09 23:35:29
要将NA保存在您想要的方式中,您可以使用data.table
library(data.table)
setDT(df)[,lapply(.SD, function(x) ifelse(all(is.na(x)), NA_integer_, sum(x, na.rm = T))),
by = Community]
# Community Pop_Total Median_Age Under_5 5-9 10-14 15-19 20-24
#1: Akutan_city NA NA NA NA NA NA 71
#2: Alcan_Border NA NA 2 NA 5 2 NA
#3: Ambler_City 224 NA NA 17 NA NA NAhttps://stackoverflow.com/questions/43880807
复制相似问题