问tidyverse，plyr和dplyr
EN

Stack Overflow用户

提问于 2022-02-12 00:44:18

回答 1查看 356关注 0票数 1

我以前在任何地方都使用dplyr，但是包含了一些plyr函数。老实说，我不知道区别是什么，也不知道为什么事情变了。相同的代码会产生不同的数据格式，这取决于我是导入了plyr还是tidyverse。我想要的是一个名为newborn_stat的数据文件，它包含每个行中唯一的c_pos和一个新的c_pos列。

raw_file_contents<- data.frame( pid=c(1,2,2,3,3), C_SYMP=c("Y","N","Y","N","N"))
newborn_stat<- raw_file_contents %>%
        group_by(pid) %>%
        summarise(c_pos= any( C_SYMP == "Y", na.rm = TRUE))

相反，我将得到一个数据框架，newborn_stat，其c_pos为1行，等于TRUE。如果我使用dplyr:：与group_by和概括，我认为我得到了正确的答案。这一切为什么要发生？我一直在使用Rmd笔记本，所以当我尝试运行包含这一行的前一个块时，事情就不起作用了。

dplyr

回答 1

Stack Overflow用户

发布于 2022-02-12 00:44:18

所以我认为这是由于dplyr和plyr的功能不同而造成的。这是一个基本正确的假设，因为dplyr和plyr都有summarize函数，而dplyr有group_by，但plyr没有。如果您稍后在块中导入plyr，然后重新运行问题中显示的表达式，则假定summarize是来自plyr命名空间的。所以在表达式中运行dplyr::group_by + plyr::summarize。

我希望他们在plyr中用不同的名字来概括。或者始终保持相同的函数名，如果这有意义的话。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71088054

复制

相似问题

问tidyverse，plyr和dplyr
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问tidyverse，plyr和dplyrEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问tidyverse，plyr和dplyr
EN