首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我是从爬虫那里得到DDOS的吗?

我是从爬虫那里得到DDOS的吗?
EN

Webmasters Stack Exchange用户
提问于 2019-04-30 18:34:09
回答 2查看 725关注 0票数 2

我的网站目前正受到垃圾邮件机器人的攻击(例如: 66.249.73.*),这导致了CPU的高使用率。谷歌/必应( Google/Bing )每秒钟爬一个网站是否很常见?

我做了反向查找的I和他们似乎是有效的爬虫使用https://support.google.com/webmasters/answer/80553?hl=en

因为我屏蔽了一些IP,Google/Bing搜索控制台正在报告错误并损害我的索引。

这个月(四月)已经发生了。这是转诊攻击吗?有可能有人在欺骗IP吗?我能做些什么来限制爬行的数量吗?

我目前正在为爬虫创建服务器端呈现,但是对于刚刚开始随机发生的事情来说,这是一个乏味的任务。

EN

回答 2

Webmasters Stack Exchange用户

发布于 2019-04-30 20:07:03

Google使用了很多IP范围。从你发布的那个,他们的任何IP在66.249.64.0 - 66.249.95.255范围内,并将自己定位为Googlebot应该是一个合法的机器人。

爬行率的增长有很多原因,也许你的一些内容是病毒传播的,或者他们的机器人想要更快地更新你网站上的数据。这通常是件好事。

我绝不会阻止谷歌的IP范围,除非你不希望访问者到达你的网站。如果你的资源被锤打,你可以做的是为Robots.txt中的其他搜索机器人指定一个爬行延迟。

谷歌不支持爬行延迟指令。然而,Google确实支持在Google搜索控制台中定义爬行率。

票数 3
EN

Webmasters Stack Exchange用户

发布于 2019-05-01 01:21:55

如果来自请求的IP地址被识别为Google/Bing的IP地址,那么您不应该阻止它们,因为这会影响您的SEO。与其阻止它们,不如在它们各自的网站管理员工具中调整爬行率

谷歌和必应都提供了调整爬行率的能力,具有很好的灵活性。

改变Googlebot爬行率

必应爬行控制

在Yandex爬行站点的情况下,您可以添加一个Crawl-delay指令来减缓yandex的爬行速度。

如果您认为存在影响您的服务器的垃圾邮件机器人(可以通过观察服务器日志来确定),请考虑使用将阻止可疑IP地址的Web应用程序防火墙。Cloudflare有能力允许已知的机器人,并根据它计算的威胁等级阻止可疑的机器人。此外,您还可以阻止某些用户代理爬行网站。

票数 1
EN
页面原文内容由Webmasters Stack Exchange提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://webmasters.stackexchange.com/questions/122575

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档