为了总结数据,我尝试用条件词创建一个新列,以匹配两个具有相同因素的列。
这就是数据文件的外观。

这就是我想总结的

这是我提议的不起作用的代码:
probe$Cluster<-"cluster"
for (i in 1:length(probe)){
if(is.na(probe[i,4])){
probe[i,9]<-probe[i,6]}
if(is.na(probe[i,6])){
probe[i,9]<-probe[i,4]}
if(identical(probe[i,4],probe[i,6])){
probe[i,9]<-probe[i,4]}}
if(!identical(probe[i,4],probe[i,6])){
probe[i,9]<-probe[i,4]
rep(probe[i,1:9]%>%probe[i,9]<-probe[i,6}
#Then create a summary of this like this:
Sum<-probe%>%group_by(Method,Cluster)%>% summarise(mean(relation, na.rm
=FALSE),numberobservations=length(unique(GenA)))%>%data.frame()谢谢你的建议
发布于 2022-08-24 21:38:31
如果没有我可以加载的样本数据(不需要重新输入图片),就无法进行验证,但是看起来您需要这样做:
library(dplyr)
probe %>%
mutate(Cluster = coalesce(ClusterA, ClusterB) %>% # use 1st non-NA from cols
group_by(Method, Cluster) %>%
summarize(mean = mean(relation, na.rm = TRUE),
numberobservations = n(), .groups = "drop")https://stackoverflow.com/questions/73479670
复制相似问题