kallisto/control-3 4 case-1 case kallisto/case-1 5 case-2 case kallisto/case-2 6 case -3 case kallisto/case-3 第一列为样本名称,第二列为样本对应的分组信息,第三列为每个样本kallisto定量结果的文件夹。 每组3个生物学重复,可以通过以下代码构建上述的数据框 samples = c( "control-1", "control-2", "control-3", "case-1", "case-2", "case 上述代码要求将所有样本的定量结果放在同一个文件夹下,目录结构如下 kallisto/ ├── control-1 ├── control-2 ├── control-3 ├── case-1 ├── case-2 └── case
读取数据 读取基因的表达量表格和样本的分组信息两个文件,其中表达量的文件示例如下 gene_id ctrl-1 ctrl-2 ctrl-3 case-1 case-2 case-3 geneA 14 分组信息的文件示例如下 sample condition ctrl-1 control ctrl-2 control ctrl-3 control case-1 case case-2 case case
读取文件 需要读取基因在所有样本中的表达量文件,示例如下 gene_id ctrl-1 ctrl-2 ctrl-3 case-1 case-2 case-3 geneA 14 0 11 4 0
读取文件 读取基因在所有样本中的表达量文件,示例如下 gene_id ctrl-1 ctrl-2 ctrl-3 case-1 case-2 case-3 geneA 14 0 11 4 0 12
CASE 4 CASE-3 的性能已经非常好了,但还是漏了一个优化的点:table 的扩容。
(CASE-3)继续移动 C。 ? 主要就这三种 CASE,我们把剩下的图都绘制出来: ? ? ? ? 总结一下: 1)若遍历到的位置为0,则说明它一定位于A的左侧。
之所以说case-3是一个中间状态,是因为根据红黑树的定义来说,下图并不是平衡的,他是通过case 2操作完后向上回溯出现的状态。