在R基地,我怎么才能
发布于 2019-06-19 10:03:19
您可以尝试以下方法
> substr(Ref2,1,2) ==gsub("[a-z| ]","",Street2)
[1] TRUE FALSE您可以使用该逻辑向量从原始数据中删除FALSE值。
代码的工作方式是只从Ref2中提取前两个字符,并从Street2中删除所有小写字符+空格。
数据
Ref2 = c("AC12","AL34")
Street2=c("Abbey Court","Albert Gardens")发布于 2019-06-19 16:37:22
只要为任何想要提取每个单词的第一个字母的人添加一个选项,如果大小写不一致,或者整个单词是相同的情况。
这还包括筛选表以供继续使用(使用data.table)。
library(data.table)
library(stringr)
data_example <- data.table(Ref2 = c("AC12", "AL34", "AG34"),
Street = c("Abbey Court", "Albert gardens", "albert gardens"))
data_example <- data_example[tolower(str_extract(Ref2, "^.{2}")) == tolower(paste0(str_extract(Street, "^."), str_extract(Street, "(?<=\\s).")))]> View(data_example)
> data_example
Ref2 Street
1: AC12 Abbey Court
2: AG34 albert gardenshttps://stackoverflow.com/questions/56664965
复制相似问题