我在几个群体中有一组标记。有些标记是跨群体共享的(可以是所有的群体,也可以是更少的标记,例如,5个群体中只有3个拥有一个标记),而其他标记则是特定群体特有的。有些标记可能在某些人群中不存在,但在另一些群体中却存在。我想数一数每个人口特有的标记。我有5个单独的文件,列出在每个群体中检测到的标记,输入文件是;
Markers_Group_1 snp1 snp2 snp3 snp4 snp5 snp6 snp7 snp8 snp9 snp10 snp11...snp100
第2组的输入文件可能有5,6,9,20-70 snps。同样,第3至第5组也是如此;也就是说,它们携带着不同的snps组合。因此,如果将所有5个文件合并到一个文件中,则会有一些单元格为空。
发布于 2019-02-27 22:39:45
我会使用Excel VLookup。
https://support.office.com/en-us/article/vlookup-function-0bbc8083-26fe-4963-8ab8-93a18ad188a1
能给你这样的东西。
ALL MARKERS File1 File2 File3 File4 last_file_with_marker COUNT
snp1 snp1 snp1 snp1 snp1 File4 4
snp2 snp2 snp2 snp2 File4 3
snp3 snp3 snp3 snp3 File3 3
snp4 snp4 File2 1
snp5 snp5 snp5 snp5 snp5 File4 4如果File1位于第2页,则File1、File2、File3、File4列中所有单元格的公式可能类似于:=VLOOKUP($A2&“,Sheet2!Data,1,FALSE)
然后您可以在下一列中添加一些内容(标题: last_file_with_marker) =查找(A2,B2:E2,$B$1:$E$1)
和一个计数列来找到只有一个的。=COUNTIF(B2:E2,A2)
您可以对计数列进行排序,以找到具有唯一标记的列。
https://stackoverflow.com/questions/54915174
复制相似问题