我有一个R脚本,它有以下一行:
KSData.dataset.abbrev = aggregate(log2FC ~ Kinase.Gene+Substrate.Gene+Substrate.Mod+Source, data=KSData.dataset.abbrev, FUN=mean)KSData.dataset.abbrev看起来是这样的:
Kinase.Gene Substrate.Gene Substrate.Mod Peptide p FC log2FC Source
364 ABL1 RBM39 Y95 YRSPYSGPK 0.019590948 1.6158045 0.692252615 PhosphoSitePlus
8 AKT1 AKT1S1 T246 LNTSDFQK 0.800879536 0.8909224 -0.166628324 PhosphoSitePlus
121 AKT1 EPHA2 S897 LPSTSGSEGVPFR 0.500658346 0.7052020 -0.503891606 PhosphoSitePlus在使用上面的代码行之后,df看起来类似于以下内容:
Kinase.Gene Substrate.Gene Substrate.Mod Source log2FC
430 ABL1 RBM39 Y95 PhosphoSitePlus 0.6922526152
19 AKT1 PEA15 S116 PhosphoSitePlus 1.1782441053
80 AKT1 MDM2 S166 PhosphoSitePlus -0.7967537534我不知道这条线到底是干什么的..。谢谢你的帮助
发布于 2019-07-09 11:57:28
我计算了mean of log2FC的唯一组组合Kinase.Gene、Substrate.Gene、Substrate.Mod和Source。
使用一个小数据示例,您可以看到aggregate正在做什么:
(tt <- data.frame(a = 1:2, b=1:3, x=1:12))
# a b x
#1 1 1 1
#2 2 2 2
#3 1 3 3
#4 2 1 4
#5 1 2 5
#6 2 3 6
#7 1 1 7
#8 2 2 8
#9 1 3 9
#10 2 1 10
#11 1 2 11
#12 2 3 12
aggregate(x ~ a, data=tt, FUN=mean) #Average for the groups in col a
# a x
#1 1 6
#2 2 7
aggregate(x ~ a + b, data=tt, FUN=mean) #Average for the groups in col a and b
# a b x
#1 1 1 4
#2 2 1 7
#3 1 2 8
#4 2 2 5
#5 1 3 6
#6 2 3 9https://stackoverflow.com/questions/56948907
复制相似问题