基本上,我有一个基因数据集,其中行是基因,列是蛋白质折叠的连续时间点。我需要一个函数来过滤来自整个数据集的其他人的某个阈值的基因,而不仅仅是某些载体。例如:
alpha98 alpha105 alpha112 alpha119
YAL002W 0.22 0.58 -0.36 0.13
YAL003W 0.05 0.55 -0.08 0.33任何帮助都是最好的。
发布于 2013-04-08 04:30:10
R是矢量化的,R是回收的。这意味着,一般来说,像myDF > threshold这样简单的东西会让你非常接近你需要的东西。
具体地说,它将为您提供一个与data.frame维度相同的逻辑matrix,当DF中的单元格超过阈值时,它将为TRUE (否则为FALSE )。
然后,您可以使用该矩阵作为工具来设置data.frame的子集。
myDF[myDF > threshold] https://stackoverflow.com/questions/15867337
复制相似问题