首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用stringdist_join()的左连接比开始时返回更多的行。

使用stringdist_join()的左连接比开始时返回更多的行。
EN

Stack Overflow用户
提问于 2018-11-05 23:19:57
回答 1查看 194关注 0票数 0

我只是在使用stringdist_join()进行左连接,并且遇到了麻烦,因为我的输出比原始的“左”数据帧有更多的行。

代码语言:javascript
复制
  nrow(records_nona)
   #output : 603

  nrow(institutions)
  # output : 981

  records_nona <- stringdist_left_join(records_nona, institutions, 
   by = c("tm_1_undergradu" = "Institution.Name"))

  nrow(records_nona)
  # output: 635

我不确定,我在这里搞砸了什么才有可能做到这一点。或者我对左连接的理解是错误的。任何指导都将不胜感激,谢谢。

EN

回答 1

Stack Overflow用户

发布于 2018-11-06 00:11:47

我能够找到解决方案,由于连接的近似性,左连接产生了重复的连接,所以我只需要减少max_dist = 1。(默认值是max_dist = 2)。现在我有了正确的行数。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53157201

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档