我偶然发现了一个Genbank格式的文件(这里显示为一个最小的虚拟示例),其中包含一个嵌套特性,如下所示:
FEATURES Location/Qualifiers
xxxx_domain complement(complement(1..145))这样的功能会使当前的Biopython Genbank解析器(1.59版本)崩溃,但在以前的版本(例如1.55)中显然不会。显然,该行为已经在1.57中(参见下面的评论)。
从Biopython bugtracker来看,旧的locationparser代码似乎在1.56中被删除了:
从我对ftp://ftp.ncbi.nih.gov/genbank/gbrel.txt和http://www.insdc.org/documents/feature_table.html#3.4.2的格式描述中可以推断出,这很可能是无效的。(但请参阅下面的评论)。
有人能对此发表评论吗。也就是说,这是Biopython中的小故障还是Genbank文件中的小故障?
完整的演示文件:
LOCUS XXXXXXXXXXXXXX 240 bp DNA circular 17-JAN-2012
DEFINITION xxxxxx.
KEYWORDS xx.
SOURCE
ORGANISM
FEATURES Location/Qualifiers
xxxx_domain complement(complement(1..145))
/vntifkey="1"
/label=A label
/note="A note"
BASE COUNT 75 a 57 c 42 g 66 t
ORIGIN
1 tttacaaaac gcattttcaa accttgggta ctaccccctt ttaaatatcc gaatacacta
61 ataaacgctc tttcctttta ggtaaacccg ccaatatata ctgatacaca ctgatagttt
121 aaactagatg cagtggccga ccatcagatc tagtaggaaa cagctatgac catgattacg
181 cattacttat ttaagatcaa ccgtaccagt ataccctgcc agcatgatgg aaacctccct
//显示错误的最小演示程序(假设已安装Biopython1.59和Python2.7,并且上述文件的名称为"test.gb":
#!/usr/bin/env python
from Bio import SeqIO
s = SeqIO.read(open("test.gb")), "r"), "genbank")这将使用以下命令崩溃
raise LocationParserError(location_line)
Bio.GenBank.LocationParserError: complement(1..145)发布于 2012-04-19 05:32:24
我认为那是一个无效的位置。这是来自NCBI文件,还是其他地方?
请注意,对于Biopython 1.60 (下一版本),我们计划将错误位置视为警告,而不是停止解析的错误。
https://stackoverflow.com/questions/10195198
复制相似问题