文章/答案/技术大牛

发布

社区首页 >问答首页 >不允许具有ID的URL被爬行

问不允许具有ID的URL被爬行
EN

Webmasters Stack Exchange用户

提问于 2019-05-26 02:16:02

回答 1查看 382关注 0票数 2

我有一个约100000网址的网站。我不允许对具有此模式的ID的所有URL进行爬行：

www.example.com/node/sport/category/id

但那些没有身份证的人：

www.example.com/node/sport/category/

我如何在robots.txt中处理这个问题？

更新：

ID是一些数字，如/12343/或/12345/等

web-crawlers

robots.txt

seo

回答 1

Webmasters Stack Exchange用户

发布于 2019-05-26 07:36:34

要实现这一点，robots.txt可以包含以下行

User-agent: *
Disallow: /*/*/*/id

您还可以在旧的搜索控制台中的robots.txt检查器中测试这一点。

票数 -1

页面原文内容由Webmasters Stack Exchange提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://webmasters.stackexchange.com/questions/123100

复制

相似问题

问不允许具有ID的URL被爬行
EN

回答 1

Webmasters Stack Exchange用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不允许具有ID的URL被爬行EN

回答 1

Webmasters Stack Exchange用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问不允许具有ID的URL被爬行
EN