我试图通过合并R中的两个数据集来集成数据,我想知道是否可以使用函数merge(),但是我想指定在一个结果列中具有相同信息的列,这里是一个例子:
数据集1 : /FirstName、LastName、年龄、年龄、眼睛-颜色
数据集2 :、FN、FN、LastName、年龄、性别、性别
我希望将dataset 1和dataset 2合并到一个数据集(dataset 3)中,并指定"FN“与"FirstName”相同,因此我希望它是一个列,因此结果应该是:
数据集3 ::FirstName,,LastName,Gender,Age,Eyes,color,color,Eyes
发布于 2019-02-01 22:22:52
您可以设置相同的列名,然后使用它合并数据。
names(dataset2)[1] = "FirstName"
dataset3 = merge(dataset1, dataset2, by="FirstName")发布于 2019-02-02 22:57:53
如果要将FN / FirstName合并为公共变量,则可以在一个dplyr链中进行rename并使用merge
dataset3 <- dataset2 %>%
rename(FirstName = FN) %>%
merge(dataset1, by = "FirstName")发布于 2019-02-02 01:20:42
对于dplyr包,您可以使用以下方法完成:
dplyr::inner_join(
x = dataset1, y = dataset2,
by = c("FirstName" = "FN")
)https://stackoverflow.com/questions/54487865
复制相似问题