文章/答案/技术大牛

发布

社区首页 >问答首页 >如何利用dplyr获取多样本点的物种丰富度和丰富度

问如何利用dplyr获取多样本点的物种丰富度和丰富度
EN

Stack Overflow用户

提问于 2018-09-28 03:17:41

回答 1查看 2.6K关注 0票数 2

问题：

我有很多站点，每个站点都有10个取样点。

Site Time Sample Species1 Species2 Species3 etc
Home    A      1        1        0        4 ...
Home    A      2        0        0        2 ...
Work    A      1        0        1        1 ...
Work    A      2        1        0        1 ...
Home    B      1        1        0        4 ...
Home    B      2        0        0        2 ...
Work    B      1        0        1        1 ...
Work    B      2        1        0        1 ...
...

我想获得丰富和丰富的每一个网站。丰富度是一个地点的物种总数，而丰富度是一个地点所有物种的所有个体的总数，如下所示：

Site Time Richness Abundance
Home    A        2         7
Work    A        3         4
Home    B        2         7
Work    B        3         4

我可以用两个函数(下面)到达那里。不过，我想两者都放在一个dplyr函数中。范围7:34指的是我的物种矩阵(每行一个站点/样本，物种作为列)。

df1 <- df %>% mutate(Abundance = rowSums(.[,4:30])) %>%
group_by(Site,Time) %>%   
    summarise_all(sum)

df1$Richness <- apply(df1[,4:30]>0, 1, sum)

如果我试图在一个函数中同时执行这两个操作，则会得到以下错误

df1 <- df  %>% mutate(Abundance = rowSums(.[,4:30]) ) %>%
   group_by(Site, Time) %>%   
   summarise_all(sum) %>% 
   mutate(Richness = apply(.[,4:30]>0, 1, sum))

Error in mutate_impl(.data, dots) : 
  Column `Richness` must be length 5 (the group size) or one, not 19

丰富部分必须在汇总函数之后，因为它必须对汇总和分组数据进行操作。

我如何使这个函数工作？

(注:这之前被标记为这个问题的副本：Manipulating seperated species quantity data into a species abundance matrix

然而，这是一个完全不同的问题--这个问题本质上是关于转移数据集和在单个物种/列中求和。这是关于跨列(多列)的所有物种的求和。此外，我认为这个问题的答案是非常有帮助的--像我这样的生态学家总是在计算丰富和丰富，我相信他们会喜欢一个专门的问题。)

grouping

dplyr

summarize

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-09-28 03:24:13

在summarise之后，我们需要ungroup

library(tidyverse)
df %>% 
  mutate(Abundance = rowSums(.[4:ncol(.)])) %>% 
  group_by(Site, Time) %>% 
  summarise_all(sum) %>%
  ungroup %>% 
  mutate(Richness = apply(.[4:(ncol(.)-1)] > 0, 1, sum)) %>%
  #or
  #mutate(Richness = rowSums(.[4:(ncol(.)-1)] > 0)) %>%
  select(Site, Time, Abundance, Richness)
# A tibble: 4 x 4
#  Site  Time  Abundance Richness
#  <chr> <chr>     <dbl>    <int>
#1 Home  A             7        2
#2 Home  B             7        2
#3 Work  A             4        3
#4 Work  B             4        3

它还可以通过首先执行group_by sum，然后执行transmute来编写。

df %>% 
  group_by(Site, Time) %>%
  summarise_at(vars(matches("Species")), sum)  %>% 
  ungroup %>%
  transmute(Site, Time, Abundance = rowSums(.[3:ncol(.)]), 
                        Richness =  rowSums(.[3:ncol(.)] > 0))

或者另一个选择是sum和map

df %>% 
   group_by(Site, Time) %>%
   summarise_at(vars(matches("Species")), sum) %>% 
   group_by(Time, add = TRUE) %>%
   nest %>% 
   mutate(data = map(data, ~ 
                 tibble(Richness = sum(.x > 0), 
                        Abundance = sum(.x)))) %>% 
   unnest

数据

df <- structure(list(Site = c("Home", "Home", "Work", "Work", "Home", 
"Home", "Work", "Work"), Time = c("A", "A", "A", "A", "B", "B", 
"B", "B"), Sample = c(1L, 2L, 1L, 2L, 1L, 2L, 1L, 2L), Species1 = c(1L, 
0L, 0L, 1L, 1L, 0L, 0L, 1L), Species2 = c(0L, 0L, 1L, 0L, 0L, 
0L, 1L, 0L), Species3 = c(4L, 2L, 1L, 1L, 4L, 2L, 1L, 1L)), 
class = "data.frame", row.names = c(NA, 
 -8L))

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/52547792

复制

相似问题

问如何利用dplyr获取多样本点的物种丰富度和丰富度
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何利用dplyr获取多样本点的物种丰富度和丰富度EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何利用dplyr获取多样本点的物种丰富度和丰富度
EN