假设我有一个数字向量,它有一些按顺序排列的数字,还有一些不是:
x <- c(1,2,3,5,6,7,8,11,14,16,17)我如何操作这一点,以便返回一个字符串,以便将序列分组在一起?
y <- "1-3, 5-8, 11, 14, 16-17"发布于 2015-09-06 03:11:01
我们通过使用diff比较相邻的元素来创建一个分组变量('gr'),检查不是1的输出,执行cumsum。我们在tapply中使用它来paste 'x‘中元素的range。
gr <- cumsum(c(TRUE,diff(x)!=1))
y <- unname(tapply(x, gr, FUN= function(.x)
paste(unique(range(.x)), collapse='-')))如果我们需要一个字符串,使用paste将'y‘放在一起,toString是paste(..., collapse=', ')的包装器
y <- toString(y)
y
#[1] "1-3, 5-8, 11, 14, 16-17"我们也可以使用任何一个按组聚合的方法来完成这个任务。例如,使用data.table,我们将'x‘转换为'data.table',按'gr’分组(使用cumsum(...)创建),我们将元素放在一起,并像以前一样使用toString。
library(data.table)
y1 <- setDT(list(x))[,paste(unique(range(V1)), collapse='-') ,
by = .(cumsum(c(TRUE, diff(V1)!=1)))]$V1
toString(y1)
#[1] "1-3, 5-8, 11, 14, 16-17"https://stackoverflow.com/questions/32419637
复制相似问题