18个细胞系分为两组-triple和Pos。基因以列的形式列出,细胞线以行的形式列出。我已经生成了一个数据帧,其中包含wilcoxon测试p值、中位数差异和Triple和Pos之间的折叠变化。我需要一个列,告诉我一个基因的“三重”细胞系的数量>0。也就是说,它应该告诉我一个特定的基因在一个“三重”细胞系中有多少次>0。这是一个有代表性的数据。我如何在R中做到这一点?
Subtype A1BG A1CF A2LD1 A2M A2ML1 A3GALT2 A4GALT A4GNT
MCF7 Pos 0 0 0 22.8 0 0 0 0
MDA_231 Triple 0 0 0 0 0 0 0 0
SKBR3 Pos 0 0 0 1.69 1.69 0 0 0
HCC1954 Pos 0 0 0 0 0 0 0 0
HCC1143 Triple 0 0 0 1.45 0 0 0 0
BT474 Pos 0 0 0 1.9 0 0 0 0
HCC1500 Pos 0 0 0 0 0 0 0 0
T47D Pos 0 0 0 1.32 0 0 0 0
ZR75-1 Pos 0 0 0 0 0 0 0 0
HCC1937 Triple 0 0 0.79 33.76 0 0 0 0
HCC1599 Triple 0 0 0 0 0 0 0 0
HCC202 Pos 0 0 0.9 5.43 0 0 0 0
HCC1806 Triple 0 0 0 0 0 0 0 0
MDA-468 Triple 0 0 1.02 3.41 0 0 0 0
HCC2218 Pos 0 0 2.08 1.39 0 0 0 0
HCC70 Triple 0 0 0 3.67 29.76 0 0 0
HCC1187 Triple 0.7 0 1.75 4.21 0 0 0 0
Hs578T Triple 0 0 0.84 1.26 0 0 0 0
BT549 Triple 0 0 0.64 0.64 0 0 0 0发布于 2014-04-15 22:51:25
你的原始帖子中的格式有点奇怪,但我认为是这样的:
df$gt0 <- apply(df[-1]>0, 1, sum)将第一列以外的每个条目都与零进行比较。然后,它会将为真的次数相加,并将每一行作为列gt0追加。它将对所有行进行计算,而不管其子类型是什么:如果您只想计算子类型"triple",则df <- subset(df, Subtype=="Triple")会将数据集缩减到相关行。
不过,当你说“特定基因”时,我想知道你是否需要一个逐行的总结:
apply(df[df$subType=="Triple",-1]>0, 2, sum)https://stackoverflow.com/questions/23086984
复制相似问题