首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用R查找数据中的缩略语

用R查找数据中的缩略语
EN

Stack Overflow用户
提问于 2017-06-13 18:20:30
回答 2查看 1.3K关注 0票数 1

在我的数据(即文本)中,有缩略语。

是否有在文本中搜索缩写的函数或代码?例如,检测3-4-5大写字母缩写,让我计算它们发生的频率。

非常感谢!

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-06-13 20:11:37

检测3-4-5大写字母缩写

你可以用

代码语言:javascript
复制
\b[A-Z]{3,5}\b

regex演示

详细信息

  • \b -一个单词边界
  • [A-Z]{3,5} - 3、4或5个大写字母(也可以使用[[:upper:]]匹配其他字母)
  • \b -一个词的边界。

R演示在线 (利用来自@TheComeOnMan的regex出现计数代码)

代码语言:javascript
复制
abbrev_regex <- "\\b[A-Z]{3,5}\\b";
x <- "XYZ was seen at WXYZ with VWXYZ and did ABCDEFGH."
sum(gregexpr(abbrev_regex,x)[[1]] > 0)
## => [1] 3
regmatches(x, gregexpr(abbrev_regex, x))[[1]]
## => [1] "XYZ"   "WXYZ"  "VWXYZ"
票数 2
EN

Stack Overflow用户

发布于 2017-06-13 18:30:42

您可以使用正则表达式[A-Z]来匹配任意的无符号字母。如果您希望这个模式重复3次,您可以将\1{3}添加到正则表达式中。考虑使用变量和一个循环来完成工作,重复3到5次。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44528816

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档