我需要根据一定的条件拆分数据帧,例如,我有一个数据帧my_df,它有一个变量k,它没有负值。每次遇到my_df时,我都需要拆分这个数据文件0。为了更清楚地解释这一点,下面是我创建my_df的代码。
my_df <- data.frame("k" = c(0, 0,0, 0.1,1.3,4,5,7,8,11,14,17,10,5,0.4,0,0,0,1.0,2.3,5,7,3,0.1,0))在执行上述代码时,我的数据文件如下所示,
row_number k
1 0
2 0
3 0
4 0.1
5 1.3
6 4
7 5
8 7
9 8
10 11
11 14
12 17
13 10
14 5
15 0.4
16 0
17 0
18 0
19 1.0
20 2.3
21 5
22 7
23 3
24 0.1
25 0当下一个值为零时,我的预期输出将对上述数据帧进行拆分。也就是说,创建一个新的数据帧df1,其中包含来自row 1 to 15的值--类似地,另一个数据帧df2被创建,包含来自row 16 -24的值,另一个数据帧df3被创建,具有来自row 25的值--这个值一直持续到数据帧的末尾。
我发现split()完成了数据框架的拆分工作,但我不知道如何在函数中实现我的需求。
发布于 2018-02-21 07:45:12
我们可以使用cumsum和diff创建一个分组变量,然后在此基础上创建split 'my_df‘,以获得data.frame的list
lst <- split(my_df, cumsum(c(TRUE, diff(!my_df$k) ==1)))
lapply(lst, row.names)
#$`1`
#[1] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10" "11" "12" "13" "14" "15"
#$`2`
#[1] "16" "17" "18" "19" "20" "21" "22" "23" "24"
#$`3`
#[1] "25"注:不使用软件包。只使用基R方法。
发布于 2018-02-21 07:53:51
在data.table中,您可以使用函数rleidv()创建分组变量:
library("data.table")
my_df <- data.frame("k" = c(0, 0,0, 0.1,1.3,4,5,7,8,11,14,17,10,5,0.4,0,0,0,1.0,2.3,5,7,3,0.1,0))
split(my_df, (rleidv(my_df$k==0) - 1) %/% 2)下面是一个基本R的解决方案
r <- rle(my_df$k!=0)
r$values <- gl((length(r$values) + 1) %/% 2, k=2, length=length(r$values))
split(my_df, inverse.rle(r))https://stackoverflow.com/questions/48900503
复制相似问题