我有两个文件new.csv和remove.txt。我正在使用AWK从生成的任何新的csv文件中使用主删除文件。这些文件是:
$ cat new.csv
james,smith,bronx,2025555551
adam,stephenson,brooklyn,2025555552
anthony,jackson,queens,2025555553
mary,young,astoria,2025555554
marsha,peterson,madison,2025555555
angie,huff,belk,2025555556然后就是:
$ cat remove.txt
2025555550
2025555553
2025555555
2025555557
2025555558
2025555559我的命令是:
$ awk -F, 'NR==FNR{remove[$4]++;next}!($4 in remove)' remove.txt new.csv > final.csv这给了我与原始文件相同的结果,如下所示:
$ cat final.csv
james,smith,bronx,2025555551
adam,stephenson,brooklyn,2025555552
anthony,jackson,queens,2025555553
mary,young,astoria,2025555554
marsha,peterson,madison,2025555555
angie,huff,belk,2025555556我怎么才能得到这个?
$ cat final.csv
james,smith,bronx,2025555551
adam,stephenson,brooklyn,2025555552
mary,young,astoria,2025555554
angie,huff,belk,2025555556发布于 2015-09-15 20:35:37
Etan Reisner's解决方案:
awk -F, 'NR==FNR{remove[$1]++;next}!($4 in remove)' remove.txt new.csv这个很好用。
对于任何对AWK了解较少的人来说,一个更详细、更程序化的解决方案是:
awk 'BEGIN {while((getline var < "remove.txt")>0) {remove[var]=0}; FS=","}
{if(!($4 in remove)) {print $0}}' new.csv在开始读取输入文件"new.csv“之前运行的BEGIN块将整个密钥文件"remove.txt”读入到一个关联数组中,该数组使用键作为删除键。它还将字段分隔符设置为",“,而不是默认的空格。主块一次读取一行输入文件,然后检查第四个(最后一个)字段是否出现在任何删除键中,否则打印。
https://stackoverflow.com/questions/31351650
复制相似问题