首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何阻止站点抓取我的站点

如何阻止站点抓取我的站点
EN

Stack Overflow用户
提问于 2011-12-10 18:48:45
回答 3查看 348关注 0票数 0

我有这个歌曲站点,不管它有什么数据,都会显示在其他站点上,即使我回放“你好”,其他站点上也是这样做的。有人知道我如何才能防止这种情况发生吗?我发现该站点正在使用file_get_contents(),我如何才能阻止他这样做呢?

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-12-15 22:26:09

你说过file_get_contents被利用了。

A URL can be used as a filename with this function if the fopen wrappers have been enabled. See fopen() for more details on how to specify the filename. See the Supported Protocols and Wrappers for links to information about what abilities the various wrappers have, notes on their usage, and information on any predefined variables they may provide.

要禁用它们,请访问http://www.php.net/manual/en/filesystem.configuration.php#ini.allow-url-fopen了解更多信息

编辑:如果他们在这之后使用CURL或类似的东西,试着通过改变HTML布局来弄乱他们的脚本,等等。如果这不起作用,试着找到脚本宿主的IP,并使其返回无稽之谈;)

Edit2:如果他们使用iframe,则使用javascript在iframe检测时重定向

票数 0
EN

Stack Overflow用户

发布于 2011-12-10 18:52:50

那么,你可以试着从他们的IP地址中找出并阻止它

票数 2
EN

Stack Overflow用户

发布于 2011-12-10 18:59:02

或者你甚至可以为爬虫生成垃圾信息,只是为了搞乱“克隆”站点。

第一个要回答的问题是:你识别出从你的网站获取信息的爬虫了吗?

如果是这样,那么你可以向这个过程提供任何你想要的东西:什么都不给(忽略/阻止),一条消息告诉所有者停止获取你的信息,把垃圾内容还给他们,……

无论如何,第一步是正确地做事情。请确保您的站点有一个带有爬虫程序接受策略的"robots.txt“。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8455965

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档