可以为CDS特征输出基因位置吗?或者我需要自己解析' location‘或'complement’字段吗?
例如,
seq = Sequence.read(genbank_fp, format='genbank')
for feature in seq.metadata['FEATURES']:
if feature['type_'] == 'CDS':
if 'location' in feature:
print 'location = ', feature['location']
elif 'complement' in feature:
print 'location = ', feature['complement']
else:
raise ValueError('positions for gene %s not found' % feature['protein_id'])将输出:
位置= <1..206
位置= 687..3158
对于this示例GenBank文件。
此功能在BioPython (请参阅this thread)中是可能的,我可以在其中输出已经解析的位置(例如。开始= 687,结束= 3158)。
谢谢!
发布于 2015-09-23 23:41:11
对于该示例,您可以使用以下代码仅获取该功能的Sequence对象:
# column index in positional metadata
col = feature['index_']
loc = seq.positional_metadata[col]
feature_seq = seq[loc]
# if the feature is on reverse strand
if feature['rc_']:
feature_seq = feature_seq.reverse_complement()注意: GenBank解析器是在开发分支中新添加的。
https://stackoverflow.com/questions/32743780
复制相似问题