大家好,我是邓飞
群体遗传学中常用的三大分析工具:主成分分析(PCA)、Admixture分析和进化树(Phylogenetic Tree),它们在分析基因型数据时各有侧重,互为补充。下面分别介绍一下。
1. 主成分分析(PCA)
作用:
PCA是一种降维技术,用于可视化基因型数据的群体结构。它通过线性变换,将高维的基因型数据(例如SNP位点)投影到低维空间(通常是2D或3D),以揭示样本间的遗传变异模式。
原理:
应用场景:
工具:

2. 主成分分析(PCA)网页版实现
http://asreml.cn/population-genetics/pca
朋友推荐了这个神奇的网站,赶快注册了一下,十分好用,还有示例数据可以练习,上传自己的数据也完全没问题,后面这几篇博客介绍一下使用方法。

数据使用的是plink的二进制文件,可以上传数据自动绘制PCA,也可以把原始的作图数据下载下来,还支持分组PCA,重要的是它把PCA的解释百分比也给出来了,满足了各种需求。
上传基因型的二进制文件,三个文件:fam、bed、bim文件

结果包括两个PCA图和两个PCA结果:

2-D的PCA结果:

3D-PCA结果:

原始作图的PCA数据:

还有每个PCA的解释百分比:

还支持分组的PCA显示,每个分组不同的颜色:


资源推荐:
1,快来领取 | 飞哥的GWAS分析教程
2,飞哥汇总 | 入门数据分析资源推荐
3,数量遗传学,分享几本书的电子版
4,R语言学习看最新版的电子书不香嘛?
5,书籍及配套代码领取--统计遗传分析导论
6,飞哥的学习圈子