大家好,我是邓飞,今天介绍一下,知道群体的单倍型数据,知道群体的表型数据,如何计算单倍型和表型数据的显著性分析,以及做一个小提琴图?

1,准备单倍型群体的vcf文件
将单倍型,按照区间,提取群体的vcf文件,如下:

2,整理表型数据的txt文件
如下:

3,使用R包geneHapR
如下:

4,读取vcf文件
如下:

5,读取表型数据
如下:

6,计算群体的单倍型(具体到个体)
如下:

7,将群体的单倍型数据保存到本地
如下:

8,单倍型和表型的显著性分析可视化
如下:

图表:

有结果可以得出,H001的单倍型的y1表现比H002的单倍型要好,H001是优势单倍型。群体中共有119个H001,9个H002。
示例数据和代码:

数据和代码放到星球上面了:

资源推荐:
1,快来领取 | 飞哥的GWAS分析教程
2,飞哥汇总 | 入门数据分析资源推荐
3,数量遗传学,分享几本书的电子版
4,R语言学习看最新版的电子书不香嘛?
5,书籍及配套代码领取--统计遗传分析导论
6,飞哥的学习圈子