首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用dplyr在R中提取具有不同客户ID的相同客户信息

使用dplyr在R中提取具有不同客户ID的相同客户信息
EN

Stack Overflow用户
提问于 2021-03-31 06:25:13
回答 1查看 39关注 0票数 0

我希望使用R中的dplyr通过不同的IDNum获得相同的数据(CompanyName、地址、城市、州和邮政编码

代码语言:javascript
复制
Company Name |  Address               | City        |  State  |  Zip    |   IDNum
Kiah Auto    |  101 Smith Ave         | Smith       |  AZ     |  87788  |   1001
Kiah Auto    |  101 Smith Ave         | Smith       |  AZ     |  87788  |   1002
ABC Auto     |  89 Broadway Ave       | Broadway    |  NY     |  10112  |   9001
ABC Auto     |  89 Broadway Ave       | Broadway    |  NY     |  10112  |   9001
XYZ Auto     |  3A West 13th Street   | San         |  CA     |  90111  |   2321
XYZ Auto     |  3A West 13th Street   | San         |  CA     |  90111  |   2001

下面是我想要实现的表格。

代码语言:javascript
复制
Company Name |  Address               | City        |  State  |  Zip    |   ID
Kiah Auto    |  101 Smith Ave         | Smith       |  AZ     |  87788  |   1001
Kiah Auto    |  101 Smith Ave         | Smith       |  AZ     |  87788  |   1002
XYZ Auto     |  3A West 13th Street   | San         |  CA     |  90111  |   2321
XYZ Auto     |  3A West 13th Street   | San         |  CA     |  90111  |   2001

提前感谢

EN

回答 1

Stack Overflow用户

发布于 2021-03-31 12:49:39

选择具有1个以上IDNum值唯一值的组。

代码语言:javascript
复制
library(dplyr)

df %>%
  group_by(Company.Name, Address, City, State, Zip) %>%
  filter(n_distinct(IDNum) > 1) %>%
  ungroup -> result

result
#  Company.Name Address             City  State   Zip IDNum
#  <chr>        <chr>               <chr> <chr> <int> <int>
#1 Kiah Auto    101 Smith Ave       Smith AZ    87788  1001
#2 Kiah Auto    101 Smith Ave       Smith AZ    87788  1002
#3 XYZ Auto     3A West 13th Street San   CA    90111  2321
#4 XYZ Auto     3A West 13th Street San   CA    90111  2001

在碱基R和data.table中也是如此。

代码语言:javascript
复制
result <- subset(df, ave(IDNum, Company.Name, Address, City, State, Zip, 
                 FUN = function(x) length(unique(x))) > 1)


#data.table
library(data.table)
setDT(df)[, .SD[uniqueN(IDNum) > 1], .(Company.Name, Address, City, State, Zip)]

data

如果使用dput以可重现的格式提供数据,则更容易提供帮助。

代码语言:javascript
复制
df <- structure(list(Company.Name = c("Kiah Auto", "Kiah Auto", "ABC Auto", 
"ABC Auto", "XYZ Auto", "XYZ Auto"), Address = c("101 Smith Ave", 
"101 Smith Ave", "89 Broadway Ave", "89 Broadway Ave", "3A West 13th Street", 
"3A West 13th Street"), City = c("Smith", "Smith", "Broadway", 
"Broadway", "San", "San"), State = c("AZ", "AZ", "NY", "NY", 
"CA", "CA"), Zip = c(87788L, 87788L, 10112L, 10112L, 90111L, 
90111L), IDNum = c(1001L, 1002L, 9001L, 9001L, 2321L, 2001L)), 
class = "data.frame", row.names = c(NA, -6L))
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66879241

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档