文章/答案/技术大牛

发布

社区首页 >问答首页 >使用R过滤文本挖掘中的注释

问使用R过滤文本挖掘中的注释
EN

Stack Overflow用户

提问于 2015-08-12 10:38:23

回答 1查看 879关注 0票数 2

我正在使用R和相对较新的编程，因此，任何帮助将不胜感激。

我是一项调查的文本挖掘，并希望过滤评论与文字组合。数据集已从csv文件中读取。

我想过滤那些包含“国外”和“收费”字样的评论。

我使用grepl函数来识别注释中的模式。通过使用以下代码，我成功地过滤了注释部分中的数据，其中包含“国外”和“收费”两个词：

ac <- filter(data, grepl("abroad|charges", Comment))

  ac$Comment

它返回带有“国外”和“收费”字样的评论，但它返回的评论可以是“国外”，也可以是“收费”。我想把这两个词结合起来。我试着用&但这不起作用。

我也尝试过子集：

ac <- subset(data, Comment %in% c("abroad", "charges"))

ac$Comment

所有这些都不返回所需的结果。我漏掉了什么明显的东西吗？如何查看只包含特定单词的评论。因此，如果我想进一步探索我的文本，我可以尝试找到“国外”和“收费”和“昂贵”的组合。

谢谢，任何帮助都会很好。

text-mining

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-08-12 11:00:16

我们可以在grep内部使用带有&运算符的双filter，它只适用于在string中同时包含“国外”和“收费”的单词TRUE。

 filter(data, grepl("abroad", Comment) & grepl('charges', Comment))

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/31962798

复制

相似问题

问使用R过滤文本挖掘中的注释
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用R过滤文本挖掘中的注释EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用R过滤文本挖掘中的注释
EN