我有一个如下所示的文件:
1 snp1 0.0 4
1 snp2 0.2 6
1 snp3 0.3 4
1 snp4 0.4 3
1 snp5 0.5 5
1 snp6 0.6 6
1 snp7 1.3 5
1 snp8 1.3 3
1 snp9 1.9 4文件是按第3列排序的。我希望第4列的平均值按第3列分组,每隔0.5个单位。例如,它应该输出如下所示:
1 snp1 0.0 4.4
1 snp6 0.6 6.0
1 snp7 1.3 4.0
1 snp9 1.9 4.0我可以打印所有没有平均值的位置,如下所示:
awk 'NR==1 {pos=$3; print $0} $3>=pos+0.5{pos=$3; print $0}' input但是我不知道如何打印第四列的平均值。如果有人能帮我找到这个问题的解决方案,那就太好了。谢谢!
发布于 2021-10-08 16:17:41
可能是这样的:
awk '
NR==1 {c1=$1; c2=$2; v=$3; n=1; s=$4; next}
$3>v+0.5 {print c1, c2, v, s/n; c1=$1; c2=$2; v=$3; n=1; s=$4; next}
{n+=1; s+=$4}
END {print c1, c2, v, s/n}
' inputhttps://stackoverflow.com/questions/69498197
复制相似问题