文章/答案/技术大牛

发布

社区首页 >问答首页 >如果某些列是常见的，则将数据帧追加到主数据框架

问如果某些列是常见的，则将数据帧追加到主数据框架
EN

Stack Overflow用户

提问于 2015-12-14 21:48:40

回答 4查看 2.5K关注 0票数 5

我想将一个数据帧附加到另一个数据帧(主数据帧)。问题是，只有它们的列的子集是常见的。而且，它们的列的顺序也可能不同。

主数据格式：

   a b  c
r1 1 2 -2
r2 2 4 -4
r3 3 6 -6
r4 4 8 -8

新数据格式：

      d  a   c
r1 -120 10 -20
r2 -140 20 -40

预期结果：

    a   b    c
r1  1   2   -2
r2  2   4   -4
r3  3   6   -6
r4  4   8   -8
r5 10 NaN  -20
r6 20 NaN  -40

有什么聪明的方法吗？This是一个类似的问题，但设置是不同的。

merge

dataframe

append

回答 4

Stack Overflow用户

回答已采纳

发布于 2015-12-14 21:53:08

查看bind_rows包中的dplyr函数。默认情况下，它将为您做一些好的事情，比如在一个data.frame中填充存在于一个NA中的列，而不是用NA来填充这些列，而不是仅仅是失败。下面是一个示例：

# Use the dplyr package for binding rows and for selecting columns
library(dplyr)

# Generate some example data
a <- data.frame(a = rnorm(10), b = rnorm(10))
b <- data.frame(a = rnorm(5), c = rnorm(5))

# Stack data frames
bind_rows(a, b)

Source: local data frame [15 x 3]

            a          b          c
1   2.2891895  0.1940835         NA
2   0.7620825 -0.2441634         NA
3   1.8289665  1.5280338         NA
4  -0.9851729 -0.7187585         NA
5   1.5829853  1.6609695         NA
6   0.9231296  1.8052112         NA
7  -0.5801230 -0.6928449         NA
8   0.2033514 -0.6673596         NA
9  -0.8576628  0.5163021         NA
10  0.6296633 -1.2445280         NA
11  2.1693068         NA -0.2556584
12 -0.1048966         NA -0.3132198
13  0.2673514         NA -1.1181995
14  1.0937759         NA -2.5750115
15 -0.8147180         NA -1.5525338

要解决问题中的问题，首先要为主data.frame中的列进行选择。如果a是主data.frame，并且b包含要添加的数据，则可以使用dplyr中的select函数获取首先需要的列。

# Select all columns in b with the same names as in master data, a
# Use select_() instead of select() to do standard evaluation.
b <- select_(b, names(a))

# Combine
bind_rows(a, b)

Source: local data frame [15 x 2]

            a          b
1   2.2891895  0.1940835
2   0.7620825 -0.2441634
3   1.8289665  1.5280338
4  -0.9851729 -0.7187585
5   1.5829853  1.6609695
6   0.9231296  1.8052112
7  -0.5801230 -0.6928449
8   0.2033514 -0.6673596
9  -0.8576628  0.5163021
10  0.6296633 -1.2445280
11  2.1693068         NA
12 -0.1048966         NA
13  0.2673514         NA
14  1.0937759         NA
15 -0.8147180         NA

票数 6

Stack Overflow用户

发布于 2015-12-14 21:56:37

试试这个：

library(plyr) # thanks to comment @ialm
df <- data.frame(a=1:4,b=seq(2,8,2),c=seq(-2,-8,-2))
new <- data.frame(d=c(-120,-140),a=c(10,20),c=c(-20,40))

# we use %in% to pull the columns that are the same in the master
# then we use rbind.fill to put in this dataframe below the master
# filling any missing data with NA values
res <- rbind.fill(df,new[,colnames(new) %in% colnames(df)])

> res
   a  b   c
1  1  2  -2
2  2  4  -4
3  3  6  -6
4  4  8  -8
5 10 NA -20
6 20 NA  40

票数 2

Stack Overflow用户

发布于 2015-12-14 22:51:43

这里发布的dplyr-和plyr-based解决方案对于这个任务来说非常自然，分别使用bind_rows和rbind.fill，尽管它也可以作为基数R中的一行。基本上，我会循环第一个数据帧的名称，如果第二个数据帧在那里，就抓取第二个数据帧的对应列，或者以其他方式返回所有NaN值。

rbind(A, sapply(names(A), function(x) if (x %in% names(B)) B[,x] else rep(NaN, nrow(B))))
#     a   b   c
# r1  1   2  -2
# r2  2   4  -4
# r3  3   6  -6
# r4  4   8  -8
# 5  10 NaN -20
# 6  20 NaN -40

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34277225

复制

相似问题

问如果某些列是常见的，则将数据帧追加到主数据框架
EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如果某些列是常见的，则将数据帧追加到主数据框架EN

回答 4

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如果某些列是常见的，则将数据帧追加到主数据框架
EN