我正在研究2600+基因组,希望研究不同群体的基因组、基因和基因间的特征。如果分类组只有很少的代表,就没有问题。在分类组具有多个基因组的情况下,我应该在什么基础上删除相似的基因组,以便从每个分类组中只获得几个代表。我是否应该使用lenght或GC%或其他特征来删除基因组-例如,如果两个基因组的GC%变异小于1%,我将删除它。类似这样的事情。请建议接受的方式,并友好地解释原因以及。tuberculosis alone which have
GC% range of 65.48 to 65.
我只需要从NCBI (GenBank(full)格式)下载完整的基因组序列。我对“全基因组”而不是“全基因组”感兴趣。gatunek, property='complete genome' )#title='complete genome[title]')结果我只得到了基因组的小片段我知道如何通过NCBI网站手动操作,但这非常耗时,我在那里使用的查询:
escherichia[orgn] AND complete genom