如果文件包含多个用逗号分隔的列,如下所示:
aaa,1,4,4,5,7
bbb,1,4,9,1,2'sort -t,-k1 file.txt‘和'sort -t,-k1,1 file.txt’有区别吗?虽然上面的例子没有区别,但在我的一些项目案例中,它确实有区别,但区别反映在我使用排序的文件连接的情况下,join命令抛出异常' join : File2 is is not to sorted order‘(当时,我使用'sort -t,-k1 file.txt')。后来我使用了'sort -t,-k1,1 file.txt',然后join命令就可以很好地工作了。有人能告诉我为什么吗?
发布于 2012-04-03 11:12:48
sort -k1表示从键1开始直到行尾的排序。sort -k1,1表示从键1到键1排序(所以只排序第一个键)。在我的机器上,如果我用-s指定稳定排序,这两种排序会有所不同
~ $ cat test.txt
aaa,1,4,4,5,7
aaa,1,3,9,1,2
~ $ sort -t, -k1 -s test.txt
aaa,1,3,9,1,2
aaa,1,4,4,5,7
~ $ sort -t, -k1,1 -s test.txt
aaa,1,4,4,5,7
aaa,1,3,9,1,2发布于 2012-04-03 11:10:49
第二个数字是排序关键字的结束位置,缺省为行尾。从手册页:
-k, --key=POS1[,POS2]:
start a key at POS1 (origin 1), end it at POS2 (default end of line)
所以,是的,这是有区别的。对于您的数据则不是这样,因为1,1排序关键字没有重复项。
但是在指定1,1排序关键字的地方,有两行代码:
abc,plugh
abc,xyzzy可以按任一顺序排序。只要使用1 (意思是1,end-of-line),它们就会按照给定的顺序进行排序。
https://stackoverflow.com/questions/9986515
复制相似问题