文章/答案/技术大牛

发布

社区首页 >问答首页 >R dplyr group_by主题似乎使用了整个数据格式而不是主题。

问R dplyr group_by主题似乎使用了整个数据格式而不是主题。
EN

Stack Overflow用户

提问于 2018-06-12 00:30:48

回答 1查看 181关注 0票数 0

背景我正在使用一个来自R的重复测量临床试验的大型数据集，在这里我想为每个主题做一些数据处理。这可以是为每个主题提取x列中的最大值，或为每个主题提取y列的平均值。

问题

我喜欢使用dplyr包和管道，这使我使用了group_by函数。但是当我尝试应用它时，我想要提取的数据似乎不是按主题分组，而是根据整个数据集提取数据。

码

这就是我到目前为止所做的：

data <- read.csv(file="group_by_question.csv", header=TRUE, sep=",")

library(dplyr)
library(plyr)

data <- tbl_df(data)

test <- data %>%
  filter(!is.na(wght)) %>%
  dplyr::group_by(subject_id) %>%
  mutate(maxwght=max(wght),meanwght=mean(wght)) %>%
  ungroup()

测试数据的样本：

在这里找到我的数据集的.csv示例：https://drive.google.com/file/d/1wGkSQyJXqSswThiNsqC26qaP7d3catyX/view?usp=sharing

dplyr

plyr

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-12 00:44:45

这是你想要的吗？在下面的示例中，输出按subject id显示maxwght列的最大值。例如，如果需要每个主题id的maxwght的平均值，则可以将max()替换为mean。

library(dplyr)

data <- read.csv(file="group_by_question.csv", header=TRUE, sep=",")

test <- data %>%
    filter(!is.na(wght)) %>%
    mutate(maxwght=max(wght),meanwght=mean(wght)) %>%
    group_by(subject_id) %>%
    summarise(value = max(maxwght)) %>%
    ungroup()

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50807745

复制

相似问题

问R dplyr group_by主题似乎使用了整个数据格式而不是主题。
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R dplyr group_by主题似乎使用了整个数据格式而不是主题。EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R dplyr group_by主题似乎使用了整个数据格式而不是主题。
EN