首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用R过滤文本挖掘中的注释

使用R过滤文本挖掘中的注释
EN

Stack Overflow用户
提问于 2015-08-12 10:38:23
回答 1查看 879关注 0票数 2

我正在使用R和相对较新的编程,因此,任何帮助将不胜感激。

我是一项调查的文本挖掘,并希望过滤评论与文字组合。数据集已从csv文件中读取。

我想过滤那些包含“国外”和“收费”字样的评论。

我使用grepl函数来识别注释中的模式。通过使用以下代码,我成功地过滤了注释部分中的数据,其中包含“国外”和“收费”两个词:

代码语言:javascript
复制
ac <- filter(data, grepl("abroad|charges", Comment))

  ac$Comment

它返回带有“国外”和“收费”字样的评论,但它返回的评论可以是“国外”,也可以是“收费”。我想把这两个词结合起来。我试着用&但这不起作用。

我也尝试过子集:

代码语言:javascript
复制
ac <- subset(data, Comment %in% c("abroad", "charges"))

ac$Comment

所有这些都不返回所需的结果。我漏掉了什么明显的东西吗?如何查看只包含特定单词的评论。因此,如果我想进一步探索我的文本,我可以尝试找到“国外”和“收费”和“昂贵”的组合。

谢谢,任何帮助都会很好。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-08-12 11:00:16

我们可以在grep内部使用带有&运算符的双filter,它只适用于在string中同时包含“国外”和“收费”的单词TRUE

代码语言:javascript
复制
 filter(data, grepl("abroad", Comment) & grepl('charges', Comment))
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31962798

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档