首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在R中创建频率矩阵的聚合函数

在R中创建频率矩阵的聚合函数
EN

Stack Overflow用户
提问于 2020-07-31 12:36:14
回答 4查看 46关注 0票数 1

我是个新手,所以请不要对我评头论足;)

我想创建一个频率矩阵,其中列名是作者,行名是具有频率计数的语言。

我的数据如下所示:

代码语言:javascript
复制
language    author
----------------------
ita         Goethe
ger         Schiller
eng         Marx
fr          Marx
po          Schiller
eng         Marx

因此,我想要这样的东西。

代码语言:javascript
复制
            ita    ger     eng     fr    po
----------------------------------------------
Schiller     0      1       0       0    1
Goethe       1      0       0       0    0
Marx         0      0       2       1    0

我尝试使用aggregate()函数,如下所示:

代码语言:javascript
复制
df1 <- lapply(df, function(x) type.convert(as.character(x)))
aggregate(. ~ language, df1, sum)

但它似乎不起作用。我如何重写它来获得第二个表。

提前谢谢你!非常感谢您的帮助。

EN

回答 4

Stack Overflow用户

回答已采纳

发布于 2020-07-31 14:05:10

利用菲尔的数据

代码语言:javascript
复制
library(tidyr)
table(dat) %>% data.frame() %>% spread(language, Freq)

#     author eng fr ger ita po
#1   Goethe   0  0   0   1  0
#2     Marx   2  1   0   0  0
#3 Schiller   0  0   1   0  1
票数 0
EN

Stack Overflow用户

发布于 2020-07-31 13:55:04

我知道您可能正在寻找一个基础版本来确定这一点,但即刻,tidyverse的方式是:

代码语言:javascript
复制
library(tidyverse)

# creating data
dat <- tribble(~language,    ~author,
        "ita",         "Goethe",
        "ger",         "Schiller",
        "eng",         "Marx",
        "fr",         "Marx",
        "po",         "Schiller",
        "eng",         "Marx")

dat %>% 
  count(language, author) %>% 
  pivot_wider(names_from = language, values_from = n, values_fill = list(n = 0))

# A tibble: 3 x 6
  author     eng    fr   ger   ita    po
  <chr>    <int> <int> <int> <int> <int>
1 Marx         2     1     0     0     0
2 Schiller     0     0     1     0     1
3 Goethe       0     0     0     1     0
票数 1
EN

Stack Overflow用户

发布于 2020-07-31 13:58:18

使用基数R:

代码语言:javascript
复制
df <- read.table(text = "
language    author
ita         Goethe
ger         Schiller
eng         Marx
fr          Marx
po          Schiller
eng         Marx", h = T)

as.data.frame.matrix(table(df$author, df$language))

         eng fr ger ita po
Goethe     0  0   0   1  0
Marx       2  1   0   0  0
Schiller   0  0   1   0  1

这将按字母顺序对行名和列名称进行排序。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63185871

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档