首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Bingbot忽略robots.txt并尝试检索trafficbasedsspsitemap.xml

Bingbot忽略robots.txt并尝试检索trafficbasedsspsitemap.xml
EN

Stack Overflow用户
提问于 2013-04-04 03:16:06
回答 2查看 2.9K关注 0票数 0

我有一个应用程序的内容不应该被公开索引。因此,我已经禁止访问所有爬虫。

robots.txt:

代码语言:javascript
复制
# Robots shouldn't index a private app.
User-agent: *
Disallow: / 

然而,必应忽略了这一点,每天都会请求一个/trafficbasedsspsitemap.xml文件,我不需要创建这个文件。

我也不需要每天收到这个文件的404错误通知。我只想让bingbot消失,那么我需要做些什么来阻止它发出请求呢?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2013-04-04 03:55:39

根据this answer的说法,这是Bingbot检查由用于IIS和Apache的Bing站点地图插件生成的XML站点地图。它显然不能被robots.txt阻止。

票数 1
EN

Stack Overflow用户

发布于 2013-04-04 03:20:54

对于那些来自谷歌的人来说-

您可以通过apache用户代理检测/重写指令阻止bot,这将允许您完全阻止bingbot。https://superuser.com/questions/330671/wildcard-blocking-of-bots-in-apache

Block all bots/crawlers/spiders for a special directory with htaccess

等。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/15796035

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档