首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >提取两个标签之间的数据

提取两个标签之间的数据
EN

Stack Overflow用户
提问于 2016-11-03 04:27:34
回答 2查看 638关注 0票数 1

经过广泛的搜索和阅读,我成功地完成了一半的工作。

下面是字符串:

代码语言:javascript
复制
<td class='bold vmiddle'> Owner CIDR: </td><td><span class='jtruncate-text'><a href="http://3.abcdef.com/ip-3/encoded/czovL215aXAubXMvdmlldy9pcF9hZGRyZXNzZXMvNDIuMjI0LjAuMA%3D%3D">42.224.0.0</a>/12</span></td>

我需要提取42.224.0.0/12来生成42.224.0.0/12

现在,我成功地通过以下方法获得了42.224.0.0

代码语言:javascript
复制
sed -n 's/^.*<a.href="[^"]*">\([^<]*\).*/\1/p'

但我不知道如何提取/12

有人能帮忙吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-11-03 04:34:02

你当时很亲密:

代码语言:javascript
复制
sed -n 's/^.*<a.href="[^"]*">\([^<]*\)<\/a>\([^<]*\).*/\1\2/p' file

所需要的只是第二个捕获组:第一个捕获组之后的<\/a>匹配<a>的结束标记,第二个捕获组\([^<]*\),然后捕获所有的内容,但不包括结束的</span>标记。

替换字符串中的\1\2简单地连接两个捕获组匹配的内容,生成带有示例输入的42.224.0.0/12

票数 1
EN

Stack Overflow用户

发布于 2016-11-03 06:35:46

你可以试试下面的awk解决方案-

代码语言:javascript
复制
vipin@kali:~$ awk -F'>|<' '{print $(NF-6),$(NF-4)}' OFS="" kk.txt
42.224.0.0/12

需要使用多个(>,<)字段分隔器。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40393877

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档