首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >比较不同列的两个文件,并打印不同的列

比较不同列的两个文件,并打印不同的列
EN

Stack Overflow用户
提问于 2014-01-26 23:43:38
回答 1查看 5.8K关注 0票数 1

我想比较一下file2的第二栏和file1的第一栏。如果它们相等,我想将file1的第二列添加到file2中,如output.txt中所示。

file2

代码语言:javascript
复制
chr5    ENST00000514151    utr5    0    +
chr5    ENST00000512281    utr5    0    +
chr5    ENST00000512281    utr5    0    +
chr5    ENST00000512281    utr5    0    +

file1

代码语言:javascript
复制
ENST00000512281    a
ENST00000504031    b
ENST00000776348    c

output.txt

代码语言:javascript
复制
chr5    a    ENST00000512281    utr5    0    +
chr5    a    ENST00000512281    utr5    0    +
chr5    a    ENST00000512281    utr5    0    +

我能把文件和

代码语言:javascript
复制
awk 'NR==FNR{a[$1];next}$2 in a{print}' file1 file2

这提供了以下产出:

代码语言:javascript
复制
chr5    ENST00000512281    utr5    0    +
chr5    ENST00000512281    utr5    0    +
chr5    ENST00000512281    utr5    0    +

但是我不知道如何在输出中添加file1的第二个colum。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-01-26 23:57:32

您可以使用$2file1中的值存储到数组中。所以你可以试着:

代码语言:javascript
复制
awk '
   NR==FNR{ 
     a[$1]=$2 ; next }
   $2 in a {
     $1=$1 FS a[$2]
     print 
   }' file1 file2

输出:

代码语言:javascript
复制
chr5 b ENST00000504031 utr5 0 +
chr5 b ENST00000504031 utr5 0 +
chr5 a ENST00000512281 utr5 0 +
chr5 a ENST00000512281 utr5 0 +
chr5 a ENST00000512281 utr5 0 +

解释:

  • 这在file2中修改了file2中的$1=$1 FS a[$2],其中FS是默认的字段分隔符,它是一个空格。然后重新构建记录,以便以后可以由print打印。
  • 如果需要,可以将print简化为1。就像$2 in a { $1=$1 FS a[$2] }1
  • 请注意,这将在file2中重新构建记录,因此任何空格或制表符序列都将被截断为输出中的单个空格。要在file2中保留原始格式,可以使用Gnu版本4中的split()函数。
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21370803

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档