问使用sed返回/abc/xyz、/abc和/xyz给定的/abc/xyz
EN

Unix & Linux用户

提问于 2019-11-03 15:10:33

回答 1查看 168关注 0票数 3

这个是可能的吗？我有一个HTML文件，包含了大量的URL和相关路径。我想把它们全部收集起来。我知道HTML不能用regex正确地解析，但我正在寻找一个解决方案，它不关心它所看到的是什么类型的数据。它应该只需提取/[A-Za-z0-9_-]*的每一次出现，包括深度为多个目录的路径。

给定/这个/is/a/测试，我应该得到：

/this
/is
/a
/test
/this/is
/this/is/a
/this/is/a/test
/is/a
/a/test
/is/a/test

我想是他们所有人。如果我能为这个问题编码一个解决方案，我肯定！

发布于 2019-11-03 19:25:41

问题的主体似乎问了两件不同的事情。这解决了第一个问题，即从输入文件中提取任何看起来与指定的regex一致的相对URL路径。

使用grep：

grep -Eio "(/[a-z0-9_-]+)+" file.html

票数 0

页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://unix.stackexchange.com/questions/550143

复制

相似问题

问使用sed返回/abc/xyz、/abc和/xyz给定的/abc/xyzEN