我想按照列对包含15列的制表符分隔的数据文件进行排序,即我的输入文件(我只说明了第0列)。
输入文件和所需输出文件
contig1 contig1
contig102 contig1
contig405 contig2
contig1 contig17
contig2 contig102
contig1005 contig405
contig17 contig1005下面的脚本排序,但既然1< 2,它给我的所有连词都有1到2,也从0< 1,是给我102前2,如何改进呢?
f1 = open('file.txt','r')
a=sorted(f1.readlines(), key=lambda l: l.split()[0]))
r=open('file.txt','w')
r.writelines(a)
f1.close发布于 2014-04-03 14:03:08
如果
l.split()[0]给出
contig1
contig102你想整理一下
int(l.split()[0][6:])这就是
1
102做
a = sorted(f1, key=lambda l: int(l.split()[0][6:]))发布于 2014-04-03 14:06:15
这个怎么样?
import re
def alphanumsort(x):
reg = re.compile('(\d+)')
splitted = reg.split(x)
return [int(y) if y.isdigit() else y for y in splitted]
print sorted(["contig1","contig20","bart30","bart03"], key = alphanumsort)https://stackoverflow.com/questions/22840045
复制相似问题