首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用tidyr重塑表

使用tidyr重塑表
EN

Stack Overflow用户
提问于 2016-01-08 18:04:39
回答 2查看 187关注 0票数 3

我有一个大的桌子,我正在尝试重塑使用tidyr和它的长格式,我想改变为宽格式。这张桌子很大,这比我想象的要复杂得多。

这张桌子看起来像这样

代码语言:javascript
复制
Codes      areas  var1  var2  var3
1111       1010    2      2    34
1112       1010    3      7    18
1113       1010    20     12   11
1114       1010    19     11   22
[...]      [...]   [...]  [...]  [...]
1111       1020    14     19   12
1112       1020    10     10   13

目标是以宽格式获得每个区域一行的变量。

比如:

代码语言:javascript
复制
Area  1111Var1 1111Var2 111Var3 1112Var1 1112Var2 1112Var3
1010    2         2        34      3       7        18

到目前为止,我已经尝试在tidyr中传播和变异,但没有取得多大的成功。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-01-08 18:51:08

您需要在这里执行三个tidyr步骤:

代码语言:javascript
复制
d %>%
  gather(key, value, -Codes, -areas) %>%
  unite(combined, Codes, key, sep = "") %>%
  spread(combined, value)

其中d是您的数据。

为了解释这些步骤:

代码语言:javascript
复制
library(tidyr)

# setting up data
d <- readr::read_delim("Codes areas var1 var2 var3
1111 1010 2 2 34
1112 1010 3 7 18
1113 1010 20 12 11
1114 1010 19 11 22
1111 1020 14 19 12
1112 1020 10 10 13", delim = " ")

首先,您需要收集var1、var2、var3列:

代码语言:javascript
复制
d %>%
  gather(key, value, -Codes, -areas)
#> Source: local data frame [18 x 4]
#> 
#>    Codes areas    key value
#>    (int) (int) (fctr) (int)
#> 1   1111  1010   var1     2
#> 2   1112  1010   var1     3
#> 3   1113  1010   var1    20
#> 4   1114  1010   var1    19
#> 5   1111  1020   var1    14
#> 6   1112  1020   var1    10
#> 7   1111  1010   var2     2
#> 8   1112  1010   var2     7
#> 9   1113  1010   var2    12
#> 10  1114  1010   var2    11
#> 11  1111  1020   var2    19
#> 12  1112  1020   var2    10
#> 13  1111  1010   var3    34
#> 14  1112  1010   var3    18
#> 15  1113  1010   var3    11
#> 16  1114  1010   var3    22
#> 17  1111  1020   var3    12
#> 18  1112  1020   var3    13

然后使用tidyr的Codes列将它们与unite组合起来

代码语言:javascript
复制
d %>%
  gather(key, value, -Codes, -areas) %>%
  unite(combined, Codes, key, sep = "")
#> Source: local data frame [18 x 3]
#> 
#>    combined areas value
#>       (chr) (int) (int)
#> 1  1111var1  1010     2
#> 2  1112var1  1010     3
#> 3  1113var1  1010    20
#> 4  1114var1  1010    19
#> 5  1111var1  1020    14
#> 6  1112var1  1020    10
#> 7  1111var2  1010     2
#> 8  1112var2  1010     7
#> 9  1113var2  1010    12
#> 10 1114var2  1010    11
#> 11 1111var2  1020    19
#> 12 1112var2  1020    10
#> 13 1111var3  1010    34
#> 14 1112var3  1010    18
#> 15 1113var3  1010    11
#> 16 1114var3  1010    22
#> 17 1111var3  1020    12
#> 18 1112var3  1020    13

现在,spread将起作用:

代码语言:javascript
复制
d %>%
  gather(key, value, -Codes, -areas) %>%
  unite(combined, Codes, key, sep = "") %>%
  spread(combined, value)
#> Source: local data frame [2 x 13]
#> 
#>   areas 1111var1 1111var2 1111var3 1112var1 1112var2 1112var3 1113var1
#>   (int)    (int)    (int)    (int)    (int)    (int)    (int)    (int)
#> 1  1010        2        2       34        3        7       18       20
#> 2  1020       14       19       12       10       10       13       NA
#> Variables not shown: 1113var2 (int), 1113var3 (int), 1114var1 (int),
#>   1114var2 (int), 1114var3 (int)
票数 6
EN

Stack Overflow用户

发布于 2016-01-08 18:51:17

我可以这样做,但它可能不是最好的/最有效的

代码语言:javascript
复制
df <- read.table(header = TRUE, stringsAsFactors = FALSE, text = '
Codes      areas  var1  var2  var3
1111       1010    2      2    34
1112       1010    3      7    18
1113       1010    20     12   11
1114       1010    19     11   22
1111       1020    14     19   12
1112       1020    10     10   13')

df_new <-
  df %>%
  gather(var_type, var_value, -areas, -Codes) %>%
  mutate(var_code = paste(Codes, var_type, sep = '_')) %>%
  select(-Codes, -var_type) %>%
  spread(var_code, var_value)

df_new

#  areas 1111_var1 1111_var2 1111_var3 1112_var1 1112_var2 1112_var3 1113_var1 1113_var2 1113_var3 1114_var1 1114_var2 1114_var3
#1  1010         2         2        34         3         7        18        20        12        11        19        11        22
#2  1020        14        19        12        10        10        13        NA        NA        NA        NA        NA        NA

我希望这能帮到你。

编辑

下面是使用unite的上述解决方案的版本,正如@David答案中所使用的那样。

代码语言:javascript
复制
df %>%
  gather(var_type, var_value, -areas, -Codes) %>%
  unite(NewCode, Codes, var_type, sep = '') %>%
  spread(NewCode, var_value)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34683331

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档