我对R非常陌生,我真的在努力变得更好,但是我已经在下面这个问题上被困了一段时间了:
我有一个数据框架,假设有6列和20行。我需要做的是根据列1和2的值对每列的数据进行洗牌,但只针对第3-6列。
我将试图举一个例子来说明这一点:我正在处理两位发言者的两份量化记录。第一栏是演讲的数字,第二栏是演讲者的数字。所以现在我需要通过Talk和Talk过滤我的数据,然后在所有其他列中随机地对我的数据进行洗牌。我需要对所有的会谈和所有发言者重复这一点。
有没有人知道怎么处理这件事?
发布于 2016-07-27 08:34:39
我们可以试试
library(data.table)
setDT(df1)[, lapply(.SD, function(x) x[sample(seq_along(x))]), .(Talk, Speaker)]或者使用dplyr
library(dplyr)
df1 %>%
group_by(Talk, Speaker) %>%
mutate_each(funs(.[sample(row_number())]))数据
set.seed(49)
df1 <- data.frame(Talk = rep(1:3, each = 3), Speaker = sample(1:3, 9,
replace=TRUE), col3 = rnorm(9), col4 = rnorm(9), col5 = rnorm(9), col6 = rnorm(9))https://stackoverflow.com/questions/38607783
复制相似问题