我试图改变字符串向量中的字符,从简单的字母字符(物种名称,例如。( c("Struthio camelus",...,))到更复杂的表达式(例如。因此,这可以用于查询科学网中的每个物种的出版物。因为我需要查询10000种类型,所以我想识别一个转换这些字符串的函数。
为了实现这一点,我已经探索了gsub()函数,但是gsub()不支持这种字符串操作。
示例:
vector.a <- c("Struthio camelus", "Rhea americana", "Rhea pennata", "Casuarius casuarius")
vector.b <- c('TS = "Struthio camelus"', 'TS = "Rhea americana"', 'TS = "Rhea pennata"', 'TS = "Casuarius casuarius"')本质上,我希望将vector.a转换为vector.b,因为后者以正确的格式查询Web数据库。单引号和双引号是必需的,如vector.b中所示,因为查询需要格式化。因此,操纵字符串的难度。
发布于 2019-08-12 04:17:45
为了总结出答案,并给出一个比paste更好的选项,如果您的替换变得更加复杂,我们可以在这里尝试使用sub:
vector.a <- c("Struthio camelus", "Rhea americana", "Rhea pennata", "Casuarius casuarius")
vector.b <- sub("^(.*)$", "TS = \"\\1\"", vector.a)
vector.b
[1] "TS = \"Struthio camelus\"" "TS = \"Rhea americana\""
[3] "TS = \"Rhea pennata\"" "TS = \"Casuarius casuarius\""发布于 2019-08-12 04:05:49
我们可以使用来自paste的base R
vector.b1 <- paste0('TS = "', vector.a, '"')
identical(vector.b, vector.b1)
#[1] TRUE基准测试
test <- rep(vector.a, 1e6)
system.time(sub("^(.*)$", "TS = \"\\1\"", test))
# user system elapsed
# 2.249 0.008 2.257
system.time(paste0('TS = "', test, '"'))
# user system elapsed
# 0.849 0.002 0.852 https://stackoverflow.com/questions/57455513
复制相似问题