文章/答案/技术大牛

发布

社区首页 >问答首页 >使用正则表达式删除R数据帧中的引号

问使用正则表达式删除R数据帧中的引号
EN

Stack Overflow用户

提问于 2015-04-18 02:49:15

回答 2查看 10.1K关注 0票数 3

下面是我的数据集(名为g)现在的样子。我在R.

Q.35 | Q.36 | age | gender | country 

2 | 2 | 1 | 20 | 2 | AU"       
3 | 5 | 5 | 21 | 1 | AU"

我想删除国家代码(AU而不是AU)上的引号。但是我尝试过的规则没有起作用。

h <- grep("\"", "", g)

h <- grep(""", "", g)

h <- grep('"', '', g)

如何删除这些引号？

编辑

啊，真灵!我应该用的是gsub而不是grep。

但是gsub搞乱了我的代码，因此我意识到必须将gsub应用于特定的变量，如下所示：

h$country.f <- gsub("\"", "", h$country.f)

regex

gsub

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-04-18 03:04:26

grep只搜索字符向量的每个元素中的匹配项，如果要替换特定模式的第一个匹配项，请使用sub或gsub替换所有匹配项。

示例

> h <- data.frame(age = c(20,21), country = c('AU"', 'AU"'))
> h$country <- gsub('"', '', h$country)
> h

#   age country
# 1  20      AU
# 2  21      AU

票数 6

Stack Overflow用户

发布于 2015-04-18 09:36:17

另外，还有一个很好的包stringr，它提供了一种操作字符串的方便方法：

df <- data.frame(age = c(20,21), country = c('AU"', 'AU"'))
require(stringr)
df$country <- str_replace_all(string = df$country, pattern = '"', replacement = "")

我喜欢使用它，因为它的语法非常简单。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/29712335

复制

相似问题

问使用正则表达式删除R数据帧中的引号
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用正则表达式删除R数据帧中的引号EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用正则表达式删除R数据帧中的引号
EN