File1看起来像这样(代谢途径:基因):
答:1
答:2
答:3
B:a
B:b
C:pp
D:经常资源
如何获得如下所示的输出文件(名为File1.new):
答:1,2,3
乙:甲,乙
C:pp
D:经常资源
我是Linux初学者。简单的解释更好!
发布于 2017-03-03 13:04:56
datamash -t: groupby 1 collapse 2 < file
A:1,2,3
B:a,b
C:pp
D:rr如果你也想要的话,
datamash -t: groupby 1 collapse 2 count 2 < file
A:1,2,3:3
B:a,b:2
C:pp:1
D:rr:1如果需要唯一字段的数量,也可以使用countunique。
https://unix.stackexchange.com/questions/348847
复制相似问题