首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏生信修炼手册

    GWAS ATLAS:最全面的GWAS数据库

    GWAS ATLAS数据库收录了来自4756个人类不同表型的GWAS结果,并进行了不同表型间的遗传相关性分析,对应的文献发表在nature genetics上,链接如下 https://www.nature.com /articles/s41588-019-0481-0 数据库的网址如下 https://atlas.ctglab.nl/ 该数据库不仅仅是一个gwas结果存储的数据库,对于收录的原始gwas结果,进行了深入挖掘 Browse GWAS 查看gwas分析结果,包含了以下几点内容 manhattan plot lead snp and risk loci gene-based association results Multiple GWAS comparison 用于比较多个gwas分析结果,有两种展示形式,第一种是多个因子的相关性分析,示意如下 ? 通过该数据库,不仅可以查看已有的gwas结果,更重要的是可以参考其后续挖掘的方法和思路。

    7.6K51发布于 2019-12-19
  • 来自专栏生物信息与临床医学专栏

    GWAS实战教程之利用PLINK进行GWAS分析

    这一期内容是GWAS实战的重点部分,小陈会教大家如何简单使用PLINK这个软件完成一个常规的GWAS分析。 mycovar, 'mycovar.tsv', sep='\t') ‍‍ ‍ ‍ 接下来把做好的mycovar.tsv文件放到plink软件所在的目录底下, 最后,我们执行如下命令即可得到一个简单的GWAS 关于如何使用PLINK进行GWAS分析就先介绍到这里,下期我会带大家解读一下结果,敬请期待!

    4.9K20编辑于 2022-08-21
  • 来自专栏生信修炼手册

    GWAS大家都知道,Gene-Based GWAS你了解吗?

    GWAS称之为全基因组关联分析,传统意义上的GWAS针对单个SNP位点进行分析,来寻找与疾病或者性状相关联的SNP位点。 在过去的几十年,依托高通量基因分型技术的快速发展,GWAS广泛应用于很多复杂疾病和性状的研究中,取得了不错的进展。 然而SNP水平的GWAS分析还存在着一些问题,通常情况下我们根据经验阈值,比如1X10-6,5X10-8来筛选统计学显著的SNP位点,这样的做法会过滤到很多p值不够小,即关联效应较弱的基因。 为此,科学家们尝试在更高水平整合SNP GWAS分析的结果,以提高GWAS检验的效能,常见的有以下两种水平 gene gene-set 第一个为基因水平,综合考虑某个基因上多个SNP位点的关联分析结果 通过这两种level的关联分析,可以更加有效的检测与疾病存在关联的基因或功能,而且这两种分析是建立在SNP GWAS水平的基础上的,这样方便我们对已有的GWAS分析结果进行二次分析,深入挖掘新的信息。

    3.4K30发布于 2019-12-19
  • 来自专栏科技记者

    Hail-GWAS教程笔记

    相约冬奥会 主要参考自:Hail | GWAS Tutorial[1]本笔记旨在提供Hail功能的概述,重点是操作和查询遗传数据集的功能。 4、开始GWAS! x=mt.GT.n_alt_alleles(), covariates=[1.0]) gwas.row.describe() ----- 让我们检查一下我们的GWAS是否使用Q-Q(分位数-分位数)图[19]得到了很好的控制。 p = hl.plot.qq(gwas.p_value) show(p) 5、混淆! 现在是曼哈顿的情节: p = hl.plot.manhattan(gwas.p_value) show(p) 我们发现了一个咖啡因的消费点!

    1.5K20编辑于 2022-03-04
  • 来自专栏生信修炼手册

    GWAS公开结果哪里找,GWAS Catalog来帮忙

    GWAS Catalog是EBI旗下的一个数据库,收录了公开发表的GWAS分析结果,截止2019-11-21,收录了16万个SNP位点和疾病之间的关联信息,更多信息汇总如下 ? 通过该网站,可以方便的查询和下载已经发表的GWAS分析结果。

    4.5K10发布于 2019-12-19
  • 来自专栏北野茶缸子的专栏

    bioinfo05-GWAS学习

    Hail | Install Hail on GNU/Linux[2] 2-输入数据类型 参考:PLINK 1.9 / 2 基本使用方法 (未完工) – GWAS实验室 – GWASLab[3] 常用格式如下 /plink --bfile test --assoc --pheno pheno_test.txt \ --out result 详细的内容可以参考:(13条消息) 笔记 GWAS 操作流程3:plink Install Hail on GNU/Linux: https://hail.is/docs/0.2/install/linux.html [3] PLINK 1.9 / 2 基本使用方法 (未完工) – GWAS GWASLab: https://gwaslab.com/2021/03/28/plink-1-9-2-%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95/ [4] (13条消息) 笔记 GWAS

    68420编辑于 2022-05-19
  • 来自专栏生信技能树

    Hail-GWAS教程笔记

    相约冬奥会 主要参考自:Hail | GWAS Tutorial[1]本笔记旨在提供Hail功能的概述,重点是操作和查询遗传数据集的功能。 4、开始GWAS! x=mt.GT.n_alt_alleles(), covariates=[1.0]) gwas.row.describe() ----- 让我们检查一下我们的GWAS是否使用Q-Q(分位数-分位数)图[19]得到了很好的控制。 p = hl.plot.qq(gwas.p_value) show(p) 5、混淆! 现在是曼哈顿的情节: p = hl.plot.manhattan(gwas.p_value) show(p) 我们发现了一个咖啡因的消费点!

    93820编辑于 2023-02-27
  • 来自专栏生物信息与临床医学专栏

    如何获取完整的GWAS summary数据(1)------GWAS catalog数据库

    在孟德尔随机化(Mendelian randomization,MR)研究中,对于暴露数据我们只需要那些显著的SNP信息,这样的信息在各种GWAS数据库中都是很容易获取的。 接下来,我将介绍如何从GWAS catalog下载完整的GWAS summary 数据 首先,进入GWAS catalog的官网(https://www.ebi.ac.uk/gwas/),点击Summary 一般这些协作体会建有自己的网站来存储数据,我们可以到它们的官网上下载完整的GWAS summary 数据。图中用红色标记的是冠心病研究的协作体。 GWAS catalog数据库是一个宝藏,米老鼠在这里抛砖引玉,希望大家能更深入地研究利用它,也欢迎私信交流你的idea(微信:MedGen16)! PS: GWAS catalog有时候需要开国外代理模式才能使用,小伙伴们提前准备好哈!

    10.1K21编辑于 2022-08-21
  • 来自专栏小明的数据分析笔记本

    跟着Nature Genetics学GWAS分析:emmax软件gwas分析qqman包展示结果

    数据分析的代码 https://github.com/HongboDoll/TomatoSuperPanGenome 论文里提供了绝大部分的数据处理代码,很好的学习材料,今天的推文我们学习一下论文中GWAS delim = "\t", col_names = FALSE) 最后格式 前两列是样本名,最后一列是表型数据,如果有缺失可以用NA代替 分隔符是制表符 image.png gwas at_snp.map | paste - at_snp.ps | awk '{print $2,$1,$4,$8}' | sed '1i\SNP CHR BP P' | sed 's/ /\t/g' > gwas.output Rscript manhattan_qq.R gwas.output gwas.png 5 manhattan_qq.R 这个脚本是论文中提供的 最后5是显著性的阈值,是自己随便写的, 整个代码能够跑通

    1.1K20编辑于 2023-08-23
  • 来自专栏科技记者

    GWAS流程知多少-Hail

    有关库的高级用法,请参阅概述[2],有关全基因组关联研究的简单示例,请参阅GWAS 教程[3],以及安装页面[4]以开始使用 Hail。 GWAS流程 Hail | GWAS Tutorial[10]提供Hail功能的广泛概述,重点是操作和查询遗传数据集的功能。我们进行了全基因组SNP关联测试,并证明了需要控制由群体分层引起的混杂。‎ Java 8 JRE: https://adoptopenjdk.net/index.html [2]概述: https://hail.is/docs/0.2/overview/index.html [3]GWAS highlight=matrix%20table [10]Hail | GWAS Tutorial: https://hail.is/docs/0.2/tutorials/01-genome-wide-association-study.html

    1.1K20编辑于 2021-12-18
  • 来自专栏育种数据分析之放飞自我

    GWAS的表型数据清洗

    GWAS的表型数据清洗 1. 表型数据的选择 动物数据中,对于大部分性状,一个个体只有一个观测值,直接用表型值进行后续的分析即可。 现在也有软件可以分析纵向数据的GWAS,比如宁超老师开发的软件(http://www.chaoning.org/Softwares/) 对于植物数据,特别是随机区组的数据,一年多点的数据,一个基因型ID 而且在GWAS中,品种是作为随机因子,如果你使用BLUP值,相当于进行了两次收缩(shrinkage)。 可以做一下GWAS的对比,看一下删除与否的效果。 GWAS分析效果好坏重点是看QQ图 6. 表型数据常见的可视化 •缺失数据可视化•直方图•箱线图 最后,祝大家元宵节快乐,阖家幸福!

    40410编辑于 2025-07-30
  • 来自专栏生物信息与临床医学专栏

    如何获取完整的GWAS summary数据(2)------ MRCIEU GWAS数据库

    在上一期的内容中,我和大家简单介绍了如何从GWAS catalog数据库中获取完整的GWAS summary数据,不知道大家有没有掌握? 今天,我将和大家分享另一个可以下载完整GWAS summary数据的网站(https://gwas.mrcieu.ac.uk/),一看到网址里的“mrcieu”大家是不是想到这个网站肯定和“TwoSampleMR 假设我们现在想寻找BMI(body mass index)的GWAS数据,可以在搜索栏里输入“body mass index”然后回车(如下图所示): 返回的结果如下图所示,这里我们需要关注标红的“GWAS 最后,希望大家都能顺利找到自己想要的GWAS数据来进行MR分析,如果有什么问题欢迎私信我加群交流(微信:MedGen16)。 PS: 与GWAS catalog数据库一样,这个网站最好也用国外代理来打开,这样会比较快。

    5.3K20编辑于 2022-08-21
  • 来自专栏育种数据分析之放飞自我

    使用bedtools进行gwas基因注释

    今天我把之前的GWAS教程更新了一般,工作量太大了,还没有搞完。我用Typora重新编辑了一下,界面美观多了,又增加了一些内容,明天下午做好之后会发个公众号,让大家领取,敬请期待呀! 今天介绍一下GWAS分析中注释的方法,我们知道,GWAS分析找到显著性SNP后,需要注释,才能找到候选的基因。 什么是注释呢? 我们知道,GWAS的依据是snp与控制性状的基因处于LD状态,所以,我们才能推断显著性的SNP附近的基因是影响性状的候选基因。那么这个附近如何确定呢?

    1.6K20编辑于 2022-12-13
  • 来自专栏育种数据分析之放飞自我

    笔记 | GWAS 操作流程5-1:根红苗正的GWAS分析软件:GEMMA

    笔记 GWAS 操作流程5-1:根红苗正的GWAS分析软件:GEMMA 1. GEMMA软件介绍 这个肯定厉害了,是「大家闺秀」,是「名门望族」,是「根红苗正」的GWAS分析软件。 ? G矩阵在output文件夹下:result.sXX.txt 「第二步:使用混合线性模型进行GWAS分析」 gemma-0.98.1-linux-static -bfile c -k output/result.sXX.txt GEMMA中LM模型和LMM模型的结果比较 setwd("/home/dengfei/gwas/qmsim/dat/plink_file/10_gemma_analysis_lmm/output")

    12.4K43发布于 2020-06-04
  • 使用TASSEL软件学习GWAS笔记总结

    大家好,我是邓飞,今天重新发一下之前写的TASSEL做GWAS分析的教程,前几天有幸和TASSEL和GAPIT软件包的作者张志武老师做了一个腾讯会议的视频沟通,张老师给我普及了很多GWAS相关的内容,受益良多 在和张老师的沟通中,张老师像我讲授了FDR和Power在GWAS中的应用,以及几种GWAS模型的特点,我受益良多,后面我会把会议中的收获总结几篇博客,一起发到公众号里面。 TASSEL的GLM和MLM分析结果 质控后的plink数据和表型数据: 「GLM的GWAS分析结果:」 「MLM的GWAS分析结果:」 2. 笔记(1/6):读取plink基因型数据和表型数据 使用TASSEL学习GWAS笔记(2/6):对基因型数据进行质控及导出基因型 使用TASSEL学习GWAS笔记(3/6):基因型数据可视化:kingship ,PCA,MDS 使用TASSEL学习GWAS笔记(4/6):一般线性模型进行GWAS分析(GLM模型) 使用TASSEL学习GWAS笔记(5/6):混合线性模型进行GWAS分析(MLM模型)

    20710编辑于 2026-03-12
  • 来自专栏生信修炼手册

    GWAS中的genotype imputation简介

    GWAS用于寻找与疾病或者特定性状相关联的SNP位点,为了更加有效的挖掘信息,GWAS需要大样本量和高密度的SNP分型结果,最佳的分型方案当然是全基因组测序,然而成百上千个样本的全基因组测序其成本依然是巨大的 ,目前更加经济有效的方案是GWAS芯片,针对特定人群,利用tag SNP的思想设计探针,覆盖的SNP位点在几十M的数量级。 相比全基因组测序,GWAS芯片确实更加经济,但是其缺点也是显而易见的,只能够分析挖掘已知的SNP位点,而且位点数据量相对较少,要知道一个全基因组测序分析得到的SNP位点在几百M左右。 第二个条件就是已知分型结果位点的比例和分布,对于需要填充的样本,要保证一定密度的分型结果,需要根据已有的分型结果来推断该样本可能的单倍型,分型结果已知的位点越多,其单倍型推断的准确性越高,填充的准确性才会越高,根据这个条件来看,GWAS

    1.9K20发布于 2019-12-19
  • 来自专栏生信技能树

    gwas信息转为bed格式

    有粉丝提问,他下载了 gwas_catalog_v1.0.2-associations_e105_r2021-12-21.tsv 文件,希望我可以帮忙看看他自己的一些表观调控区域里面是否有这些gwas 看了看他下载的 gwas_catalog_v1.0.2-associations_e105_r2021-12-21.tsv 文件,非常的复杂, 列比较多,如下所示: $ cat gwas_catalog_v1.0.2 首先,对gwas_catalog_v1.0.2-associations_e105_r2021-12-21.tsv 文件里面含有 dbsnp数据库的ID的,进行如下所示的代码: grep rs gwas_catalog_v1.0.2 sort-bed gwas_with_rs.bed > tmp awk '{print "chr"$0}' tmp |uniq > gwas_with_rs.bed # 一般来说, bed文件是不足够的 awk -F"\t" '{print $21}'|grep chr > gwas_without_rs.txt (m6a) jmzeng 15:57:34 ~/m6a $ head gwas_without_rs.txt

    1.1K10编辑于 2022-03-03
  • 来自专栏生信修炼手册

    基于家系数据的GWAS分析

    通过GWAS分析可以寻找与某一疾病或性状相关的突变位点,传统的GWAS都是基于control/case的设计,通过比较健康人群和患病人群中突变位点或者基因型频率的差异,最终确定相关的位点。 为了将这个传递关系考虑进来,针对家族遗传病的GWAS分析,提出了新的分析方法-TDT。 plink 软件可以进行家系数据的GWAS分析,用法如下 plink --file mydata --tdt 会生成plink.tdt文件,其中每列的含义如下 Column Meaning CHR Chromosome

    1.5K50发布于 2020-05-11
  • 来自专栏育种数据分析之放飞自我

    笔记 GWAS 操作流程6-2:手动计算GWAS分析中的GLM和Logistic模型

    GWAS系列相关 笔记 | GWAS 操作流程1:下载数据 笔记 | GWAS 操作流程2-1:缺失质控 笔记 | GWAS 操作流程2-2:性别质控 笔记 | GWAS 操作流程2-3:最小等位基因频率 笔记 | GWAS 操作流程2-4:哈温平衡检验 笔记 | GWAS 操作流程2-5:杂合率检验 笔记 | GWAS 操作流程2-6:去掉亲缘关系近的个体 笔记 | GWAS 操作流程3:plink关联分析 笔记 | GWAS 操作流程4-1:LM模型assoc 笔记 | GWAS 操作流程4-2:LM模型linear+数值协变量 笔记 | GWAS 操作流程4-3:LM模型+因子协变量 笔记 | GWAS 操作流程4-4:LM模型+数值+因子协变量 笔记 | GWAS 操作流程4-5:LM模型+数值+因子+PCA协变量 笔记 | GWAS 操作流程5-1:根红苗正的GWAS分析软件:GEMMA 笔记 | GWAS 操作流程5-2:利用GEMMA软件进行LMM+PCA+协变量 笔记 | GWAS 操作流程6-1:为何有些SNP效应值大却不显著?

    3.2K32发布于 2020-09-30
  • 来自专栏育种数据分析之放飞自我

    使用TASSEL学习GWAS笔记(46):一般线性模型进行GWAS分析(GLM模型)

    一般线性模型(GLM)介绍 GLM模型中,将每个SNP作为固定因子进行回归分析,进行显著性检验,P值就是GWAS分析的p-value,effect就是SNP的effect值。 GLM结果查看 可以看到,Result中有两个GLM结果,第一个为GWAS结果,第二个为每个SNP的效应值情况。看第一个就行。 因为这是多个性状的分析,所以所有结果放在了一起。

    3.4K40发布于 2021-09-03
领券