文章/答案/技术大牛

发布

社区首页 >问答首页 >文本分析

问文本分析
EN

Stack Overflow用户

提问于 2019-06-19 09:57:56

回答 2查看 28关注 0票数 0

在R基地，我怎么才能

Ref2 -参考文献的前两个首字母，例如AC12 = AC，AL34 = AL
Street2 -每条街的第一个首字母，例如Abbey Court = AC，Albert Gardens = AG.
比较Ref2和Street2，看看是否相同
然后，只使用那些不一样的进一步使用。计算

comparison

grepl

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-06-19 10:03:19

您可以尝试以下方法

> substr(Ref2,1,2) ==gsub("[a-z| ]","",Street2)
[1]  TRUE FALSE

您可以使用该逻辑向量从原始数据中删除FALSE值。

代码的工作方式是只从Ref2中提取前两个字符，并从Street2中删除所有小写字符+空格。

数据

Ref2 = c("AC12","AL34")
Street2=c("Abbey Court","Albert Gardens")

票数 1

Stack Overflow用户

发布于 2019-06-19 16:37:22

只要为任何想要提取每个单词的第一个字母的人添加一个选项，如果大小写不一致，或者整个单词是相同的情况。

这还包括筛选表以供继续使用(使用data.table)。

library(data.table)
library(stringr)

data_example <- data.table(Ref2 = c("AC12", "AL34", "AG34"), 
                           Street = c("Abbey Court", "Albert gardens", "albert gardens"))

data_example <- data_example[tolower(str_extract(Ref2, "^.{2}")) == tolower(paste0(str_extract(Street, "^."), str_extract(Street, "(?<=\\s).")))]

> View(data_example)
> data_example
   Ref2         Street
1: AC12    Abbey Court
2: AG34 albert gardens

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56664965

复制

相似问题

问文本分析
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问文本分析EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问文本分析
EN