import pysam

my_bam_file = '/path/to/your/bam_file.bam'
imported = pysam.AlignmentFile(my_bam_file, mode = 'rb')  # 'rb' ~ read bam
coverage = imported.count_coverage(
                  contig = '1',     # Chromosome ID; also might be "chr1" or similar 
                  start = 1599812,
                  stop = 1599813,
                  )
print(coverage)

请注意，这是可行的，因为正如pysam API glossary中所指出的，

使用半开区间，因此范围[1599812,1599813]将恰好包括一个碱基对。

运行上面的代码会得到类似下面这样的结果：

> (array('L', [0]), array('L', [0]), array('L', [0]), array('L', [0]))

其是分别包含覆盖该基因组位置的读物中的A、C、G和T碱基的数目的阵列的元组。如果您只对映射到此特定基因组位置的读取总数感兴趣，则可以对此元组求和：

import numpy as np

print(np.sum(coverage))

票数 2

Stack Overflow用户

发布于 2015-06-12 19:58:58

如果您设置相同的开始和结束，则堆积将仅引用该特定位置。例如(纯samtools)：

$ samtools mpileup -r chr1:808957-808957 YourFile.bam
chr1    808957  N   102 READSTRING READQUALITYSTRING

显示了覆盖1号染色体位置808957的第102个阅读片段。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/30697271

复制

相似问题

问使用Pysam访问特定位置的Bam文件
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Pysam访问特定位置的Bam文件EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用Pysam访问特定位置的Bam文件
EN