文章/答案/技术大牛

发布

社区首页 >问答首页 >根据存在R的数据框行赋值分组变量

问根据存在R的数据框行赋值分组变量
EN

Stack Overflow用户

提问于 2018-07-31 01:32:35

回答 3查看 35关注 0票数 2

我在R中有一个类似这样的列表：

cat1  
cat7  
cat10  
cat4  
frog  
dino11  
dino12  
dino15  
rabbit

我需要创建一个新的数据帧，如下所示：

cat1 frog  
cat7 frog  
cat10 frog  
cat4 frog  
dino11 rabbit  
dino12 rabbit  
dino15 rabbit

想法？谢谢!

dplyr

gsub

回答 3

Stack Overflow用户

发布于 2018-07-31 01:36:45

我们基于数字在'v1‘中未出现的情况创建一个分组变量，获取lag，创建一个新列'v2’作为'v1‘的last元素，删除每个组的last行和感兴趣的select列

library(tidyverse)
df %>%
  group_by(grp = lag(cumsum(grepl("^[^0-9]+$", v1)), default = 0)) %>% 
  mutate(v2 = last(v1)) %>% 
  slice(-n()) %>%
  ungroup %>%
  select(-grp)
# A tibble: 7 x 2
#  v1     v2    
#  <chr>  <chr> 
#1 cat1   frog  
#2 cat7   frog  
#3 cat10  frog  
#4 cat4   frog  
#5 dino11 rabbit
#6 dino12 rabbit
#7 dino15 rabbit

数据

df <- structure(list(v1 = c("cat1", "cat7", "cat10", "cat4", "frog", 
"dino11", "dino12", "dino15", "rabbit")), .Names = "v1",
 class = "data.frame", row.names = c(NA, -9L))

票数 2

Stack Overflow用户

发布于 2018-07-31 01:38:44

与@akrun的答案类似，但使用data.table：

library(data.table)
setDT(df)

df[, .(
  anum = v1[-.N], 
  a = v1[.N]
), by=.(g = cumsum(!(shift(v1) %like% "\\d")))]

   g   anum      a
1: 1   cat1   frog
2: 1   cat7   frog
3: 1  cat10   frog
4: 1   cat4   frog
5: 2 dino11 rabbit
6: 2 dino12 rabbit
7: 2 dino15 rabbit

票数 2

Stack Overflow用户

发布于 2018-07-31 01:41:34

仅使用base R，您就可以使用grepl和rle完成此操作。

where <- grepl("[[:digit:]]", x)
r <- rle(where)
A <- x[where]
B <- rep.int(x[!where], times = r$lengths[r$values])

data.frame(A, B)
#       A      B
#1   cat1   frog
#2   cat7   frog
#3  cat10   frog
#4   cat4   frog
#5 dino11 rabbit
#6 dino12 rabbit
#7 dino15 rabbit

数据。

x <- scan(what = character(), text = "
cat1  
cat7  
cat10  
cat4  
frog  
dino11  
dino12  
dino15  
rabbit  
")

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/51599413

复制

相似问题

问根据存在R的数据框行赋值分组变量
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问根据存在R的数据框行赋值分组变量EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问根据存在R的数据框行赋值分组变量
EN