下面是我的数据集(名为g)现在的样子。我在R.
Q.35 | Q.36 | age | gender | country
2 | 2 | 1 | 20 | 2 | AU"
3 | 5 | 5 | 21 | 1 | AU" 我想删除国家代码(AU而不是AU)上的引号。但是我尝试过的规则没有起作用。
h <- grep("\"", "", g)
h <- grep(""", "", g)
h <- grep('"', '', g)如何删除这些引号?
编辑
啊,真灵!我应该用的是gsub而不是grep。
但是gsub搞乱了我的代码,因此我意识到必须将gsub应用于特定的变量,如下所示:
h$country.f <- gsub("\"", "", h$country.f)发布于 2015-04-18 03:04:26
grep只搜索字符向量的每个元素中的匹配项,如果要替换特定模式的第一个匹配项,请使用sub或gsub替换所有匹配项。
示例
> h <- data.frame(age = c(20,21), country = c('AU"', 'AU"'))
> h$country <- gsub('"', '', h$country)
> h
# age country
# 1 20 AU
# 2 21 AU发布于 2015-04-18 09:36:17
另外,还有一个很好的包stringr,它提供了一种操作字符串的方便方法:
df <- data.frame(age = c(20,21), country = c('AU"', 'AU"'))
require(stringr)
df$country <- str_replace_all(string = df$country, pattern = '"', replacement = "")我喜欢使用它,因为它的语法非常简单。
https://stackoverflow.com/questions/29712335
复制相似问题