首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >tidyverse,plyr和dplyr

tidyverse,plyr和dplyr
EN

Stack Overflow用户
提问于 2022-02-12 00:44:18
回答 1查看 356关注 0票数 1

我以前在任何地方都使用dplyr,但是包含了一些plyr函数。老实说,我不知道区别是什么,也不知道为什么事情变了。相同的代码会产生不同的数据格式,这取决于我是导入了plyr还是tidyverse。我想要的是一个名为newborn_stat的数据文件,它包含每个行中唯一的c_pos和一个新的c_pos列。

代码语言:javascript
复制
raw_file_contents<- data.frame( pid=c(1,2,2,3,3), C_SYMP=c("Y","N","Y","N","N"))
newborn_stat<- raw_file_contents %>%
        group_by(pid) %>%
        summarise(c_pos= any( C_SYMP == "Y", na.rm = TRUE))

相反,我将得到一个数据框架,newborn_stat,其c_pos为1行,等于TRUE。如果我使用dplyr::与group_by和概括,我认为我得到了正确的答案。这一切为什么要发生?我一直在使用Rmd笔记本,所以当我尝试运行包含这一行的前一个块时,事情就不起作用了。

EN

回答 1

Stack Overflow用户

发布于 2022-02-12 00:44:18

所以我认为这是由于dplyrplyr的功能不同而造成的。这是一个基本正确的假设,因为dplyrplyr都有summarize函数,而dplyrgroup_by,但plyr没有。如果您稍后在块中导入plyr,然后重新运行问题中显示的表达式,则假定summarize是来自plyr命名空间的。所以在表达式中运行dplyr::group_by + plyr::summarize

我希望他们在plyr中用不同的名字来概括。或者始终保持相同的函数名,如果这有意义的话。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71088054

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档