首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏育种数据分析之放飞自我

    vcftools教程1:Linux系统中安装vcftools

    解压缩 unzip vcftools-vcftools-v0.1.16-18-g581c231.zip cd vcftools-vcftools-581c231/ 3. /vcftools-vcftools-581c231/src/perl” make[2]: 离开目录“/opt/vcftools/vcftools-vcftools-581c231/src/perl” make[2]: 进入目录“/opt/vcftools/vcftools-vcftools-581c231/src” make[3]: 进入目录“/opt/vcftools/vcftools-vcftools make[3]: 离开目录“/opt/vcftools/vcftools-vcftools-581c231/src” make[2]: 离开目录“/opt/vcftools/vcftools-vcftools make[2]: 离开目录“/opt/vcftools/vcftools-vcftools-581c231” make[1]: 离开目录“/opt/vcftools/vcftools-vcftools-

    3.4K11编辑于 2022-12-13
  • 来自专栏小明的数据分析笔记本

    使用vcftools根据vcf文件计算种群核苷酸多样性

    提取指定的样本并删除indel vcftools --gzvcf Massoko_Dryad_VCF_final.vcf.gz --keep inds_to_keep.txt --stdout --recode Massoko_Dryad_VCF_final_subset_noIndels.vcf.gz 为了减小计算压力,进一步对文件进行处理(这一步使用到的两个参数自己还不太明白是什么意思,这一步完全照搬原教程) vcftools --stdout --recode --recode-INFO-all | bgzip > Massoko_Dryad_VCF_final_subset_noIndels_maf05.vcf.gz vcftools Massoko_Dryad_VCF_final_subset_noIndels_maf05_thinned1K.vcf | grep "benthic" > benthic.txt 计算群体核苷酸多样性 vcftools Massoko_Dryad_VCF_final_subset_noIndels_maf05_thinned1K.vcf --keep littoral.txt --window-pi 100000 --out littoral_pi vcftools

    10K22发布于 2020-03-03
  • 来自专栏小明的数据分析笔记本

    R语言XML包获得html文件中的表格小实例

    另外vcftools工具只保留vcf文件中的二等位基因 vcftools --vcf input.vcf --min-alleles 2 --max-alleles 2 --recode --recode-INFO-all --out output_vcf_prefix vcftools的帮助文档 --min-alleles <integer> --max-alleles <integer> Include only For example, to include only bi-allelic sites, one could use: vcftools --vcf file1.vcf --min-alleles

    2.9K20发布于 2020-03-03
  • 来自专栏科技记者

    GWAS和群体遗传学笔记

    主要使用vcftools进行,所以输入文件是测序后分析出的vcf文件,生成的还是vcf。 软件主页:http://vcftools.github.io/ vcftools主要用于处理vcf文件,功能有以下几个: 过滤特定变异 比较文件 汇总变异 转换成其他文件格式 验证和合并文件 创建交集和子集 5.群体结构分析 vcftools转换格式从vcf到plink格式ped,然后plink转换成二进制格式bed。 admixture进行群体结构分析。

    2.9K42发布于 2020-06-16
  • 来自专栏科技记者

    SNP2HLA学习笔记

    arrogantrobot/23andme2vcf 运行命令为: perl 23andme2vcf.pl /path/to/23andme_raw.txt /path/to/output.vcf 2.2 vcf2ped 使用vcftools wget https://sourceforge.net/projects/vcftools/files/vcftools_0.1.13.tar.gz tar zxvf vcftools_0.1.13. tar.gz cd vcftools_0.1.13 make 使用命令为: . /vcftools --vcf ~/ywc.vcf --out .

    1.5K30发布于 2020-03-03
  • 来自专栏生信修炼手册

    X染色体的基因型填充

    Split the data into PAR and non-PAR 将PAR区域和非PAR区域分开,代码如下 # 根据非PAR区域的染色体位置进行提取 vcftools \ --gzvcf gwas.data.vcf.gz --from-bp 2699520 \ --to-bp 154931043 \ --recode \ --out Non.PAR.gwas.data # 剔除非PAR区域,保留PAR区域的位点信息 vcftools Split the non-PAR data by Sex 对于非PAR区域, 将男性样本和女性样本分开,代码如下 # 根据样本ID进行提取 vcftools \ --vcf Non.PAR.gwas.data.recode.vcf \ --keep male.sample.list \ --recode \ --out Male.Non.PAR.gwas.data vcftools \ --vcf Non.PAR.gwas.data.recode.vcf

    1.2K30发布于 2019-12-19
  • 来自专栏小明的数据分析笔记本

    根据vcf文件计算SNP密度并用circlize可视化结果

    参考 收集vcftools所有用法 命令 vcftools --vcf snp.bialles.vcf --SNPdensity 100000 --out StatResults/SNPdensity vcftools计算SNP密度的时候是否可以设置滑动窗口?

    4.8K20发布于 2020-03-03
  • 来自专栏小明的数据分析笔记本

    大肠杆菌全基因组重测序变异检测小实例(侧重变异过滤)

    ./ mkdir vcf_handling cd vcf_handling vcftools --vcf .. /output_results/sim_variants_3sample.vcf --freq2 --out sim_variant_AF 计算每个个体的平均深度 vcftools --vcf .. /output_results/sim_variants_3sample.vcf --depth --out sim_variant_depth 计算每个变异位点的平均深度 vcftools --vcf /output_results/sim_variants_3sample.vcf --site-mean-depth --out sim_variant_sitedepth 计算位点平均质量值 vcftools image.png 这部分的解释自己还没有太看懂,留待后续分解 根据位点质量值和测序深度过滤我们的vcf文件 vcftools --vcf ..

    2K10发布于 2020-03-03
  • 来自专栏生信修炼手册

    VCF转换PLINK格式的3种方法

    documentation/tooldocs/3.8-0/org_broadinstitute_gatk_tools_walkers_variantutils_VariantsToBinaryPed.php 2. vcftools vcftools是操作vcf文件的一款常用工具,支持将vcf文件转换成plink对应的ped/map格式,基本用法如下 vcftools --vcf input.vcf --plink --out

    11.6K60发布于 2019-12-19
  • 来自专栏生物信息学

    利用GCAT工具做PCA分析

    利用bcftools工具将所有vcf文件合并 bcftools merge chr1.vcf.gz chr2.vcf.gz chr3.vcf.gz > chr123.vcf.gz 利用vcftools和 用vcftools做格式转换 ##--plink输出plink可处理的文件格式vcftools --vcf A01.vcf --plink --out A01 生成.map和.ped(.ped文件具体信息可查看单倍型分析软件 "))) 文中用到几个工具下载链接如下: https://github.com/samtools/bcftools/releases https://sourceforge.net/projects/vcftools

    2.6K30发布于 2020-04-13
  • 来自专栏小明的数据分析笔记本

    使用smartpca做种群遗传学中常用的PCA分析实例

    RWG-050 RWG-052 RWG-118 RWG-119 RWG-120 RWG-121 RWG-122 RWG-123 RWG-124 RWG-125 RWG-126 RWG-131 使用 vcftools 工具从所有样本的vcf文件中选取所需要的样本,将样本名字放到文本文件里,我命名为 Japonica_Indica_sample_name.txt vcftools --vcf 412_all_cp.recode.eva.vcf recode-INFO-all --out keep_20_indv 查看新生成的文件的样本名 bcftools query -l keep_20_indv.recode.vcf 接下来的分析只保留snp位点 vcftools

    5.5K31发布于 2020-03-03
  • 来自专栏育种数据分析之放飞自我

    GBS hapmap 格式 转化为Plink格式方法

    本文介绍如何tassel 和vcftools两个软件,将hapmap格式的数据转化为plink格式的数据。 环境:linux系统 2. git clone https://bitbucket.org/tasseladmin/tassel-5-standalone.git 2.2 安装vcftools https://anaconda.org /bioconda/vcftools conda install -c bioconda vcftools 2.3 安装R语言 https://anaconda.org/r/r conda install vcf4.0 格式的文件 run_pipeline.pl -fork1 -h test.sort.hmp.txt -export -exportType VCF 生成一个test.vcf文件 5.3 使用vcftools 生成plink文件 vcftools --vcf test.vcf --plink --out tassel.test.vcf2plink 生成tassel.test.vcf2plink文件 5.4

    3.2K20发布于 2019-10-24
  • 来自专栏生信小王子

    一文掌握Plink文件格式转换

    assets/plink_linux_x86_64_20200219.zip ## 解压 unzip plink_linux_x86_64_20200219.zip vcf 转为 ped/map ## 使用vcftools vcftools --vcf snp.vcf --plink --out snp ## 使用plink plink --vcf snp.vcf --recode --out snp ped和map文件是

    2.8K20发布于 2020-08-10
  • 来自专栏实验盒

    使用Hapbin基于EHH、iHS、XP-EHH方法检测基因组中的选择信号

    如果是 vcf 格式,可以用 vcftools 转换格式:vcftools --gzvcf genotypes.vcf.gz --IMPUTE 。

    2.9K20发布于 2021-09-22
  • 来自专栏GWAS

    PLNIK 的多种文件格式转换

    vcf 转为 ped/map 使用vcftools vcftools --vcf snp.vcf --plink --out snp 使用plink plink --vcf snp.vcf --recode

    3.5K00编辑于 2022-02-05
  • 来自专栏生信菜鸟团

    如何将基因型数据转为 012 格式

    可根据不同软件所需的格式提取数据: echo "snpid chr pos" >snpsloc.txt awk '{print $2,"chr"$1,$4}' test.map >>snpsloc.txt vcftools 除了用 plink 转换外,还可以用 vcftools 得到 012 格式的矩阵。 plink1.9 --bfile test.genotypes_no_missing_IDs --recode vcf-iid --out test.genotypes_no_missing_IDs 用 vcftools 生成 012 矩阵: vcftools --vcf test.genotypes_no_missing_IDs.vcf --012 --out snp_matrix --012 参数会生成三个文件: 794299 1 800909 1 817186 1 817341 1 818161 1 818802 1 818812 1 818954 所以根据 vcftools

    12.8K50发布于 2020-06-04
  • 来自专栏育种数据分析之放飞自我

    GBS hapmap 格式 转化为Plink格式方法

    本文介绍如何tassel 和vcftools两个软件,将hapmap格式的数据转化为plink格式的数据。 环境:linux系统 2. git clone https://bitbucket.org/tasseladmin/tassel-5-standalone.git 2.2 安装vcftools https://anaconda.org /bioconda/vcftools conda install -c bioconda vcftools 2.3 安装R语言 https://anaconda.org/r/r conda install

    69410编辑于 2024-12-30
  • 来自专栏小明的数据分析笔记本

    文献笔记四十三:不同形态的南瓜重测序探索与形态和有价值的农艺性状有关的基因组变异

    关于连锁不平衡的一系列计算还有点看不明白) Genetic pairwise differentiation 无根网络 SplitsTree Weir and Cockerham's Fst 表示亚种间的遗传距离 vcftools blast方法鉴定带有TRM结构域的蛋白,evalue设置10-50 序列比对IQ-tree构建进化树 两种方法评估树的支持率 鉴定经受不同选择压力的候选基因 计算Fst和Tajima's D 使用vcftools

    1.2K20发布于 2020-03-03
  • 来自专栏生信技能树

    把含有多样本的vcf文件拆分

    参考:https://www.biostars.org/p/224702/ 非常多已经造好的轮子可以完成,包括bcftools,vcftools,还有大名鼎鼎的GATK,随便举例如下: module

    3.5K40发布于 2018-09-21
  • 来自专栏生信修炼手册

    bcftools安装简介

    对VCF/BCF 建立索引 对应的子命令为index bcftools 是C语言开发的,所以处理速度非常快,可以看做是VCFtools 的升级版本。

    4.8K10发布于 2020-05-11
领券