文章/答案/技术大牛

发布

社区首页 >问答首页 >提取两个标签之间的数据

问提取两个标签之间的数据
EN

Stack Overflow用户

提问于 2016-11-03 04:27:34

回答 2查看 638关注 0票数 1

经过广泛的搜索和阅读，我成功地完成了一半的工作。

下面是字符串：

<td class='bold vmiddle'> Owner CIDR: </td><td><span class='jtruncate-text'><a href="http://3.abcdef.com/ip-3/encoded/czovL215aXAubXMvdmlldy9pcF9hZGRyZXNzZXMvNDIuMjI0LjAuMA%3D%3D">42.224.0.0</a>/12</span></td>

我需要提取42.224.0.0和/12来生成42.224.0.0/12。

现在，我成功地通过以下方法获得了42.224.0.0：

sed -n 's/^.*<a.href="[^"]*">\([^<]*\).*/\1/p'

但我不知道如何提取/12。

有人能帮忙吗？

awk

sed

grep

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-11-03 04:34:02

你当时很亲密：

sed -n 's/^.*<a.href="[^"]*">\([^<]*\)<\/a>\([^<]*\).*/\1\2/p' file

所需要的只是第二个捕获组:第一个捕获组之后的<\/a>匹配<a>的结束标记，第二个捕获组\([^<]*\)，然后捕获所有的内容，但不包括结束的</span>标记。

替换字符串中的\1\2简单地连接两个捕获组匹配的内容，生成带有示例输入的42.224.0.0/12。

票数 1

Stack Overflow用户

发布于 2016-11-03 06:35:46

你可以试试下面的awk解决方案-

vipin@kali:~$ awk -F'>|<' '{print $(NF-6),$(NF-4)}' OFS="" kk.txt
42.224.0.0/12

需要使用多个(>,<)字段分隔器。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40393877

复制

相似问题

问提取两个标签之间的数据
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问提取两个标签之间的数据EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问提取两个标签之间的数据
EN