首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >stringdist_join导致NAs

stringdist_join导致NAs
EN

Stack Overflow用户
提问于 2017-09-21 14:41:22
回答 1查看 620关注 0票数 3

为了使模糊连接,我正在试验字符串包,我遇到了一个问题,我不明白,也找不到答案。我想用"dl“方法连接这两个数据表,它产生一个NA,这一点我完全不理解。也许你们中的一个对此有个解释。守则:

代码语言:javascript
复制
library(fuzzyjoin)
test1<-as.data.frame(test1<-c("techniker"))
test2<-as.data.frame(test2<-c("technician"))
setnames(test2,1,"label")
setnames(test1,1,"label")
x <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl") 

但是,如果我使用jaccard方法,则有一个匹配:

代码语言:javascript
复制
y <- stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="jaccard", q=4) 

希望任何人都能澄清。

欢呼声圆顶

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-09-21 15:35:17

默认情况下,max_dist设置为2。

dl"tekniker"之间的距离大于2。

所以没有匹配的。

代码语言:javascript
复制
stringdist_join(test1, test2, by = "label", mode = "left", distance_col="distance", method="dl",max_dist=5)
#     label.x label.y distance
# 1 techniker  techni        3
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46346918

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档