首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >不允许具有ID的URL被爬行

不允许具有ID的URL被爬行
EN

Webmasters Stack Exchange用户
提问于 2019-05-26 02:16:02
回答 1查看 382关注 0票数 2

我有一个约100000网址的网站。我不允许对具有此模式的ID的所有URL进行爬行:

www.example.com/node/sport/category/id

但那些没有身份证的人:

www.example.com/node/sport/category/

我如何在robots.txt中处理这个问题?

更新:

ID是一些数字,如/12343//12345/

EN

回答 1

Webmasters Stack Exchange用户

发布于 2019-05-26 07:36:34

要实现这一点,robots.txt可以包含以下行

代码语言:javascript
复制
User-agent: *
Disallow: /*/*/*/id

您还可以在旧的搜索控制台中的robots.txt检查器中测试这一点。

票数 -1
EN
页面原文内容由Webmasters Stack Exchange提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://webmasters.stackexchange.com/questions/123100

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档