文章/答案/技术大牛

发布

社区首页 >问答首页 >如何使用仅使用目标列的一个值的扩展函数？

问如何使用仅使用目标列的一个值的扩展函数？
EN

Stack Overflow用户

提问于 2020-02-09 15:07:08

回答 3查看 77关注 0票数 3

我们有以下数据框架a，如下所示：

 > a
    google_prod      Value
1     categoria          ML
2        google         120
3       youtube          24
4     categoria          AO
5        google           2
6       youtube           0
7     categoria          ML
8        google          27
9       youtube           0
10    categoria          AO
11       google           5
12      youtube           0

我们想得到这样的信息：

    categoria google_prod    Value
1          ML   google        120
2          ML   youtube        24
3          AO   google          2
4          AO   youtube         0      
5          ML   google         27
6          ML   youtube         0    
7          AO   google          5
8          AO    youtube        0

换句话说，执行would或类似函数的一种类型的应用程序，其中只从google_prod列中提取一个值来应用它，在这种情况下，它将是‘分类’值。

tidy

spread

回答 3

Stack Overflow用户

回答已采纳

发布于 2020-02-09 18:08:59

下面是使用cumsum创建一个组并提取first元素的另一个想法

library(dplyr)
mydf %>% 
   group_by(grp = cumsum(google_prod == 'categoria')) %>% 
   mutate(categoria = first(Value)) %>% 
   slice(-1) %>% 
   ungroup %>%
   select(-grp) %>%
   type.convert(as.is = TRUE)
# A tibble: 8 x 3
#  google_prod Value categoria
#  <chr>       <int> <chr>    
#1 google        120 ML       
#2 youtube        24 ML       
#3 google          2 AO       
#4 youtube         0 AO       
#5 google         27 ML       
#6 youtube         0 ML       
#7 google          5 AO       
#8 youtube         0 AO

数据

mydf <- structure(list(google_prod = c("categoria", "google", "youtube", 
"categoria", "google", "youtube", "categoria", "google", "youtube", 
"categoria", "google", "youtube"), Value = c("ML", "120", "24", 
"AO", "2", "0", "ML", "27", "0", "AO", "5", "0")),
 class = "data.frame", row.names = c("1", 
"2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12"))

票数 1

Stack Overflow用户

发布于 2020-02-09 15:22:13

library(tidyverse)

# getting the data
category <- rep(c("categoria",  "google",   "youtube"), 4)
value <- c("ML", "120", "24",   "AO",   "2",    "0",    "ML",   "27",   "0",    "AO",   "5",    "0")

df <- tibble(category, value)

df %>%
  mutate(helper = rep(1:(nrow(df)/3), each = 3)) %>%
  pivot_wider(names_from = category, values_from = value) %>%
  select(-helper) %>%
  pivot_longer(names_to = "google_prod",  values_to = "values", -1)

# # A tibble: 8 x 3
# categoria google_prod values
# <chr>     <chr>       <chr> 
# 1 ML        google      120   
# 2 ML        youtube     24    
# 3 AO        google      2     
# 4 AO        youtube     0     
# 5 ML        google      27    
# 6 ML        youtube     0     
# 7 AO        google      5 
# 8 AO        youtube     0

票数 2

Stack Overflow用户

发布于 2020-02-09 15:28:25

其中一个想法如下。就我所看到的模式而言，您的目标是在Value中包含两个大写字母的值。我搜索了他们使用grep()的地方，并获得了信息。使用这些信息，我使用findIntervals()创建了一个组变量。对于每一组，我聚合数据；我提取大写字母值并将其放入categoria中。以类似的方式，我又创建了两个列。他们是名单。因此，我最后使用了unnest()来获得输出。

library(tidyverse)

ind <- grep(x = mydf$Value, pattern = "[A-Z]+")

group_by(mydf, group = findInterval(x = 1:n(), vec = ind)) %>%
summarize(categoria = Value[google_prod == "categoria"],
          Google_prod = list(google_prod[google_prod != "categoria"]),
          Value = list(Value[google_prod != "categoria"])) %>% 
unnest(cols = Google_prod:Value)

  group categoria Google_prod Value
  <int> <chr>     <chr>       <chr>
1     1 ML        google      120  
2     1 ML        youtube     24   
3     2 AO        google      2    
4     2 AO        youtube     0    
5     3 ML        google      27   
6     3 ML        youtube     0    
7     4 AO        google      5    
8     4 AO        youtube     0

数据

mydf <- structure(list(google_prod = c("categoria", "google", "youtube", 
"categoria", "google", "youtube", "categoria", "google", "youtube", 
"categoria", "google", "youtube"), Value = c("ML", "120", "24", 
"AO", "2", "0", "ML", "27", "0", "AO", "5", "0")), class = "data.frame", row.names = c("1", 
"2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12"))

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60138006

复制

相似问题

问如何使用仅使用目标列的一个值的扩展函数？
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用仅使用目标列的一个值的扩展函数？EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用仅使用目标列的一个值的扩展函数？
EN