首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >文本分析

文本分析
EN

Stack Overflow用户
提问于 2019-06-19 09:57:56
回答 2查看 28关注 0票数 0

在R基地,我怎么才能

  • Ref2 -参考文献的前两个首字母,例如AC12 = AC,AL34 = AL
  • Street2 -每条街的第一个首字母,例如Abbey Court = AC,Albert Gardens = AG.
  • 比较Ref2和Street2,看看是否相同
  • 然后,只使用那些不一样的进一步使用。 计算
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-06-19 10:03:19

您可以尝试以下方法

代码语言:javascript
复制
> substr(Ref2,1,2) ==gsub("[a-z| ]","",Street2)
[1]  TRUE FALSE

您可以使用该逻辑向量从原始数据中删除FALSE值。

代码的工作方式是只从Ref2中提取前两个字符,并从Street2中删除所有小写字符+空格。

数据

代码语言:javascript
复制
Ref2 = c("AC12","AL34")
Street2=c("Abbey Court","Albert Gardens")
票数 1
EN

Stack Overflow用户

发布于 2019-06-19 16:37:22

只要为任何想要提取每个单词的第一个字母的人添加一个选项,如果大小写不一致,或者整个单词是相同的情况。

这还包括筛选表以供继续使用(使用data.table)。

代码语言:javascript
复制
library(data.table)
library(stringr)

data_example <- data.table(Ref2 = c("AC12", "AL34", "AG34"), 
                           Street = c("Abbey Court", "Albert gardens", "albert gardens"))

data_example <- data_example[tolower(str_extract(Ref2, "^.{2}")) == tolower(paste0(str_extract(Street, "^."), str_extract(Street, "(?<=\\s).")))]
代码语言:javascript
复制
> View(data_example)
> data_example
   Ref2         Street
1: AC12    Abbey Court
2: AG34 albert gardens
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56664965

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档