首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何为apache nutch设置Regex网站URL?

如何为apache nutch设置Regex网站URL?
EN

Stack Overflow用户
提问于 2020-02-26 07:17:47
回答 1查看 39关注 0票数 0

我正在尝试设置apache nutch只抓取指定域名的网站使用正则表达式。我没有太多使用Regex的经验,而且我在如何在Regex中做我的域名时遇到了麻烦。域名是https://www.health.gov.au/,我希望任何网页与这个域名后面的任何其他要被接受的正则表达式。耽误您时间,实在对不起

编辑例如,我希望正则表达式接受https://www.health.gov.au/health-topics

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-02-26 09:48:58

您可以使用(https://www.health.gov.au/.*)

这将匹配https://www.health.gov.au/之后的所有字符

RegexDemo

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60404581

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档