首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从GenBank文件输出基因位置

从GenBank文件输出基因位置
EN

Stack Overflow用户
提问于 2015-09-23 23:34:15
回答 1查看 52关注 0票数 0

可以为CDS特征输出基因位置吗?或者我需要自己解析' location‘或'complement’字段吗?

例如,

代码语言:javascript
复制
seq = Sequence.read(genbank_fp, format='genbank')
for feature in seq.metadata['FEATURES']:
    if feature['type_'] == 'CDS':
        if 'location' in feature:
            print 'location = ', feature['location']
        elif 'complement' in feature:
            print 'location = ', feature['complement']
        else:
            raise ValueError('positions for gene %s not found' % feature['protein_id'])

将输出:

位置= <1..206

位置= 687..3158

对于this示例GenBank文件。

此功能在BioPython (请参阅this thread)中是可能的,我可以在其中输出已经解析的位置(例如。开始= 687,结束= 3158)。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2015-09-23 23:41:11

对于该示例,您可以使用以下代码仅获取该功能的Sequence对象:

代码语言:javascript
复制
# column index in positional metadata
col = feature['index_']
loc = seq.positional_metadata[col]
feature_seq = seq[loc]
# if the feature is on reverse strand
if feature['rc_']:
    feature_seq = feature_seq.reverse_complement()

注意: GenBank解析器是在开发分支中新添加的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32743780

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档