大家好,我正在处理基因型数据,我有床,bim和fam文件与GWAS的汇总统计。因为个人数量很多,所以我想从我的二进制文件中随机抽取3000份。换句话说,我想对二进制文件进行子集。你知道我怎样才能用plink,R或python来做到这一点吗?
发布于 2022-06-15 16:29:49
您可以使用PLINK来实现这一点。首先,创建要子集的个人列表,并将其命名为individuals.txt。接下来,运行以下命令为individuals.txt中的个人创建一个单独的二进制文件
plink --bfile toy --keep individuals.txt --make-bed --out toy_subset
希望这能有所帮助。
https://stackoverflow.com/questions/72625812
复制相似问题