文章/答案/技术大牛

发布

社区首页 >问答首页 >如何防止恶意爬虫抓取部署在Heroku上的rails应用程序？

问如何防止恶意爬虫抓取部署在Heroku上的rails应用程序？
EN

Stack Overflow用户

提问于 2011-04-21 14:01:39

回答 1查看 2K关注 0票数 4

我想限制爬虫对我在Heroku上运行的rails应用程序的访问。如果我使用的是Apache或nginX，这将是一项简单的任务。由于该应用程序部署在Heroku上，因此我不确定如何在HTTP服务器级别限制访问。

我曾尝试使用robots.txt文件，但有问题的爬虫程序不支持robot.txt。

以下是我正在考虑的解决方案：

1) rails层中用于限制访问的before_filter。

2)基于机架的解决方案来限制访问

我想知道是否有更好的方法来处理这个问题。

ruby-on-rails

heroku

robots.txt

回答 1

Stack Overflow用户

回答已采纳

发布于 2011-04-23 18:24:59

我读过有关蜜罐解决方案的文章:您有一个不能爬行的URI (将其放在robots.txt中)。如果任何IP调用此URI，则阻止它。我会将其作为一个Rack中间件来实现，这样就不会影响到整个Rails堆栈。

对不起，我用谷歌搜索了一下，但找不到原文。

票数 9

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/5740179

复制

相似问题

问如何防止恶意爬虫抓取部署在Heroku上的rails应用程序？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何防止恶意爬虫抓取部署在Heroku上的rails应用程序？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何防止恶意爬虫抓取部署在Heroku上的rails应用程序？
EN