我目前正在编写一种代码,该代码适用于实验中的各种数据集,该实验考察了可能不存在于每次重复中的广泛变量。我的第一步是创建一个包含所有可能变量的空数据集,然后编写一个函数,该函数保留输入的数据集中的列,并删除其余的列。以下是我想要如何实现这一点的一个示例:
x<-c("a","b","c","d","e","f","g")
y<-c("c","f","g")有没有一种方法可以移除y中不存在的x元素和/或保留y中存在的x的值?
发布于 2015-02-18 19:01:26
对于您的第一个问题:“我的第一步是创建一个包含所有可能变量的空数据集”,我将对所有向量的连接使用factor,例如:
all_vect = c(x, y)
possible = levels(factor(all_vect))然后,对于第二部分“编写一个函数,该函数保留被输入的数据集中的列并删除其余的列”,我将这样写:
df[,names(df)%in%possible]发布于 2015-02-18 20:30:29
正如akrun所写的,使用intersect(x,y)或
> x[x %in% y]https://stackoverflow.com/questions/28581291
复制相似问题