我试图使用工作名称和测试集对数据进行子集。
ws_data <- subset(data, grepl(paste0("v*[0-9]_",ws_names, collapse="|" ),
rownames(data))==TRUE)它似乎工作正常,但对于行名,如
"(Difluoromethoxy)trifluoromethane"只是跳过了。这些括号在R中是否允许作为合法名称?如何解决不更改行名的问题?提前感谢!
数据示例
64 v0064_(氯)(三氟化)氟烷
65 -v0067_(二氯)二氟甲烷
正则表达式
行名(Ts)1“溴三氟甲烷”行名(数据)1 "v0001_Bromotrifluoromethane“grepl(”V0-9*_溴三氟甲烷“,行名(数据)1) 1真grepl(“v*0-9_溴三氟甲烷”,行名(数据)1) 1真
发布于 2013-06-12 21:25:36
我猜您面临的问题是括号在正则表达式中有意义。This post有解决这个问题的方法,您可以使用它来执行如下操作:
quotemeta <- function(x) gsub("([^A-Za-z_0-9])", "\\\\\\1", x)
data[grepl(paste0("^v[0-9]*_", quotemeta(ws_names), collapse="|"), rownames(data)), ]发布于 2013-06-12 20:20:15
通常,您可以在名称和行名中有类似字符的行名,在使用它们时只需引用它们。我认为这里的问题是subset函数,它允许一些不寻常的方法来指定子集,这使得一些事情变得更容易,但其他的更困难。它试图弄清楚行名是什么意思(而不仅仅是把它们当作文字字符串),括号可能会混淆这个过程。
试一试如下:
data[ grepl( paste0("v*[0-9]_",ws_names, collapse="|" ), rownames(data)), ]如果您可以构造名称列表,也可以使用%in%简化此操作。
请参阅fortune(69),==TRUE是多余的,比添加0或乘以1稍微少一些。
https://stackoverflow.com/questions/17074086
复制相似问题