文章/答案/技术大牛

发布

社区首页 >问答首页 >如何提取一行后行范围

问如何提取一行后行范围
EN

Unix & Linux用户

提问于 2017-07-03 20:47:50

回答 2查看 154关注 0票数 1

我正在尝试提取一个包含domain:的行，然后是从nameservers"到]的一系列行。我知道如何分别使用grep和awk分别完成这些工作，但不知道如何一次完成。

输入数据：

domain: stackexchange.com date: Mon Jul 3 00:43:49 2017 output_dir:        /tmp/stackexchange.com.12653
INFO:root:crawl: exiting dom: 'stackexchange.com' took: 10s
INFO:root:2017-07-03 00:44:06:370 slave.py: exiting args.url: 'stackexchange.com' took: 3s
+ comparing web systems

  "mail_server_ip": [],              |   "mail_server_ip": []
  "nameservers": [
    "ns-925.awsdns-51.net.",
    "ns-1029.awsdns-00.org.",
    "ns-cloud-d1.googledomains.com.",
    "ns-cloud-d2.googledomains.com.",
  ],
  "nameservers_domains": [           |   "nameservers_domains": [], 
    "m

期望产出：

  domain: stackexchange.com date: Mon Jul 3 00:43:49 2017 output_dir:        
  "nameservers": [
    "ns-925.awsdns-51.net.",
    "ns-1029.awsdns-00.org.",
    "ns-cloud-d1.googledomains.com.",
    "ns-cloud-d2.googledomains.com.",
  ],

单独提取数据的命令：

  grep "domain:" test_sample.txt      
  awk '/nameservers"/,/]/' test_sample.txt

awk

回答 2

Unix & Linux用户

回答已采纳

发布于 2017-07-03 21:48:03

awk方法

awk '/^domain:/{print}/"nameservers":/,/]/' test_sample.txt

票数 0

Unix & Linux用户

发布于 2017-07-03 21:03:32

采用P (PCRE)选项的grep方法：

grep -Poz 'domain: .+ output_dir:|\s*"nameservers": \[[^][]+\],\n' test_sample.txt

产出：

domain: stackexchange.com date: Mon Jul 3 00:43:49 2017 output_dir:
  "nameservers": [
    "ns-925.awsdns-51.net.",
    "ns-1029.awsdns-00.org.",
    "ns-cloud-d1.googledomains.com.",
    "ns-cloud-d2.googledomains.com.",
  ],

主要的模式是基于regex交替组<domain_line>|<nameservers_lines>。

票数 0

页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://unix.stackexchange.com/questions/375065

复制

相似问题

问如何提取一行后行范围
EN

回答 2

Unix & Linux用户

Unix & Linux用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何提取一行后行范围EN

回答 2

Unix & Linux用户

Unix & Linux用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何提取一行后行范围
EN