首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >grepl用于查找单词

grepl用于查找单词
EN

Stack Overflow用户
提问于 2019-07-11 15:01:46
回答 1查看 173关注 0票数 0

我正试着在一些单词中找出西班牙语单词。我有来自excel的所有西班牙语单词,但我不知道如何附加到帖子中(它有80000多个单词),我正在尝试检查是否有一些单词在上面。

例如:

代码语言:javascript
复制
words = c("Silla", "Sillas", "Perro", "asdfg")

我试着用这个solution

代码语言:javascript
复制
grepl(paste(spanish_words, collapse = "|"), words) 

但是有太多的西班牙语单词,并给出了这个错误:

Error

所以..。我能做的是谁?我还尝试了这个:

代码语言:javascript
复制
toupper(words) %in% toupper(spanish_words)

Result

正如你所看到的,这个选项只在完全匹配的情况下给出TRUE,我需要"Sillas“也显示为TRUE (它是silla的复数)。这就是我首先尝试grepl的原因,因为get复数也是如此。

有什么想法吗?

EN

回答 1

Stack Overflow用户

发布于 2019-07-11 15:24:01

作为df:

代码语言:javascript
复制
df <- tibble(text = c("some words", 
                      "more words", 
                      "Perro", 
                      "And asdfg", 
                      "Comb perro and asdfg"))

单词向量:word <- c("Silla","Sillas","Perro","asdfg") word <- tolower(paste( words,collapse = "|"))

然后使用mutatestr_detect

代码语言:javascript
复制
df %>% 
  mutate(
   text = tolower(text), 
   spanish_word = str_detect(text, words)
 )

返回:

代码语言:javascript
复制
text                 spanish_word
  <chr>                <lgl>       
1 some words           FALSE       
2 more words           FALSE       
3 perro                TRUE        
4 and asdfg            TRUE        
5 comb perro and asdfg TRUE    
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56983390

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档