经过广泛的搜索和阅读,我成功地完成了一半的工作。
下面是字符串:
<td class='bold vmiddle'> Owner CIDR: </td><td><span class='jtruncate-text'><a href="http://3.abcdef.com/ip-3/encoded/czovL215aXAubXMvdmlldy9pcF9hZGRyZXNzZXMvNDIuMjI0LjAuMA%3D%3D">42.224.0.0</a>/12</span></td>我需要提取42.224.0.0和/12来生成42.224.0.0/12。
现在,我成功地通过以下方法获得了42.224.0.0:
sed -n 's/^.*<a.href="[^"]*">\([^<]*\).*/\1/p'但我不知道如何提取/12。
有人能帮忙吗?
发布于 2016-11-03 04:34:02
你当时很亲密:
sed -n 's/^.*<a.href="[^"]*">\([^<]*\)<\/a>\([^<]*\).*/\1\2/p' file所需要的只是第二个捕获组:第一个捕获组之后的<\/a>匹配<a>的结束标记,第二个捕获组\([^<]*\),然后捕获所有的内容,但不包括结束的</span>标记。
替换字符串中的\1\2简单地连接两个捕获组匹配的内容,生成带有示例输入的42.224.0.0/12。
发布于 2016-11-03 06:35:46
你可以试试下面的awk解决方案-
vipin@kali:~$ awk -F'>|<' '{print $(NF-6),$(NF-4)}' OFS="" kk.txt
42.224.0.0/12需要使用多个(>,<)字段分隔器。
https://stackoverflow.com/questions/40393877
复制相似问题