我有一个数据框架,并希望根据第一列中的名称与向量中的名称的部分匹配来筛选它。
nam <- c('mmu_mir-1-3p','mmu_mir-1-5p','mmu-mir-3-5p','mir-4','mmu-mir-6-3p') #factor
aa <- c('12854','36','5489','54485','2563') #numeric
df <- data.frame(nam,aa)
vector <- c('mir-1','mir-3','mir-6')我需要在新的数据框架中有行,其中df$nam中的名称与vector中的名称部分匹配。所以new_df应该是这样的。
new_nam <- c('mmu_mir-1-3p','mmu_mir-1-5p','mmu-mir-3-5p','mmu-mir-6-3p') #factor
new_aa <- c('12854','36','5489','2563') #numeric
new_df <- data.frame(new_nam,new_aa)发布于 2020-02-13 16:13:05
我们可以将‘paste’的元素转换成一个由|和usse折叠的字符串,即在grepl或str_detect中对行进行折叠。
library(dplyr)
library(stringr)
df %>%
filter(str_detect(nam, str_c(vector, collapse="|")))
# nam aa
#1 mmu_mir-1-3p 12854
#2 mmu_mir-1-5p 36
#3 mmu-mir-3-5p 5489
#4 mmu-mir-6-3p 2563在base R中,这可以通过subset/grepl来完成。
subset(df, grepl(paste(vector, collapse= "|"), nam))https://stackoverflow.com/questions/60212181
复制相似问题