我正在尝试获得人类特有的snp,并下载hg38 fasta和ensembl灵长类共同祖先fasta (homo_sapiens_ancestor_GRCh38.tar.gz)。是否有一个工具来比较它们并输出包含hg38和灵长类共同祖先之间差异的vcf?谢谢你的帮助。
发布于 2022-09-09 03:16:55
所以你需要的是使用某种比对器将灵长类基因组与hg38基因组对齐。然后,使用这个对齐的bam (或sam)文件,您可以使用samtools运行mpil阵,将它传递给bcftools来调用变体(生成vcf文件)。
通常这是通过测序数据来完成的,但是也许你可以通过将灵长类动物fasta拆分成'reads‘来模仿它。这可以用多种语言来完成,我现在就不想讲了。然后,“读取”文件( fast或fastq具有测序的质量分数)可以通过hg38或bwa-mem与bowtie2基因组对齐,然后生成的sam或bam (sam的二进制版本)可以在bcftools中运行,以确定变体并输出vcf。这是一个有用的网站。http://samtools.sourceforge.net/mpileup.shtml有很多关于这个过程的解压,所以如果你需要更多的指导,请评论更多。
https://stackoverflow.com/questions/73630611
复制相似问题