这个是可能的吗?我有一个HTML文件,包含了大量的URL和相关路径。我想把它们全部收集起来。我知道HTML不能用regex正确地解析,但我正在寻找一个解决方案,它不关心它所看到的是什么类型的数据。它应该只需提取/[A-Za-z0-9_-]*的每一次出现,包括深度为多个目录的路径。
给定/这个/is/a/测试,我应该得到:
/this
/is
/a
/test
/this/is
/this/is/a
/this/is/a/test
/is/a
/a/test
/is/a/test我想是他们所有人。如果我能为这个问题编码一个解决方案,我肯定!
发布于 2019-11-03 19:25:41
问题的主体似乎问了两件不同的事情。这解决了第一个问题,即从输入文件中提取任何看起来与指定的regex一致的相对URL路径。
使用grep:
grep -Eio "(/[a-z0-9_-]+)+" file.htmlhttps://unix.stackexchange.com/questions/550143
复制相似问题