我需要使用regexs来解析数据文件的特定行。我的test命令使用match可以工作,我的测试命令可以用于特定的行号,但是当我将它们放在一起时,我没有得到任何输出。
gawk 'NR==42 {print $0}' filename打印出整个第42行
gawk 'match($0, /([0-9]+)/, a) {print NR ":" a[1]}' filename有很多打印输出,但具体输出如下: 42:137674所以,我的第42行有一个数字匹配
gawk 'NR==42 match($0, /([0-9]+)/, a) {print NR ":" a[1]}' filename没有打印出任何东西,我也不知道为什么。
我有一个解决办法:
gawk 'match($0, /([0-9]+)/, a) {if (NR==42) print NR ":" a[1]}' filename但我认为它的性能较差,所以我想弄清楚为什么另一个命令不能工作
编辑:回答,我完全忘记了NR和match之间的&&
发布于 2020-07-01 20:11:14
快速回答:问题的解决方案是添加缺少的and运算符:
NR==42 && match($0, /([0-9]+)/, a) 在操作中发生了什么?
Awk程序通常编写为一组模式-动作对:
pattern { action }当pattern为true时执行action。
上面使用的pattern为:
NR==42 match($0, /([0-9]+)/, a)由于运算符的优先顺序,它实际上类似于:
NR == (42 match($0, /([0-9]+)/, a))为了举例,我们假设我们使用的是NR==42。match函数根据是否找到匹配项返回0或1。正如在OP中提到的,如果是NR==42,则match函数返回1。pattern现在显示为:
42 == (42 1)expr expr形式的运算符类似于字符串连接,因此在awk中,它被处理为
42 == ("42" "1")
42 == "421"当且仅当两个操作数都是数值时,运算符==才是数值运算符。但是"421"是一个字符串,所以它会将NR的数值转换为字符串:
"42" == "421"这是假的,因此action将不会被执行。
注意:当且仅当match函数在行420上返回false或在行421上返回true时,才会执行上述操作
https://stackoverflow.com/questions/58242179
复制相似问题