我想合并两个数据表上的多列使用数据表。
## The two tables
A <- data.table(a = 1:4, b = 12:15, c = 10:13)
a b c
1: 1 12 10
2: 2 13 11
3: 3 14 12
4: 4 15 13
B <- data.table(a = 1:3, b = 12:14, d = 10:12, e = 10:12)
a b d e
1: 1 12 10 10
2: 2 13 11 11
3: 3 14 12 12 我想得到这样的结果:
A <- merge(A, B, by = c('a', 'b'), all.x = T)
a b c d e
1: 1 12 10 10 10
2: 2 13 11 11 11
3: 3 14 12 12 12
4: 4 15 13 NA NAThis answer表明,数据表可以在内存中编辑A数据帧,因此在使用大型数据集时效率更高。建议的代码是
A[B, bb:=i.b, on='a']我如何修改这段代码,使A数据帧合并到内存中,并得到与上面相同的结果?
发布于 2017-08-14 23:04:56
如果我们想做join的话。这里不需要i.d或i.e,因为列在'B‘中是唯一的
nm1 <- setdiff(names(B), names(A))
A[B, (nm1) := mget(nm1), on = .(a, b)]
A
# a b c d e
#1: 1 12 10 10 10
#2: 2 13 11 11 11
#3: 3 14 12 12 12
#4: 4 15 13 NA NAhttps://stackoverflow.com/questions/45677425
复制相似问题