我想从一个包含tblastn搜索结果的大型XML文件中提取前四名,该文件在我的本地核苷酸数据库中搜索了多个蛋白质查询。但是,问题是,我的when设置有一些查询,结果不到四次命中,所以当我运行这段代码时: with open('/home/edson/ungulate/tblastn_result_test_xml') as tblastn_file: for tblastn_rec
我开发了以下代码来计算对齐中相同站点的数量。不幸的是,代码是缓慢的,我必须对数百个文件进行迭代,处理1000多个对齐需要花费近12个小时,这意味着更快10倍的代码是合适的。如能提供任何帮助,将不胜感激:from Bio import SeqIOfrom Bio import AlignIOfrom Bio.Alphabet import generic_dnaim