我知道要阻止人们窃取我们的数据是不可能的,但是我有一个很大的数据库,我想至少防止自动脚本窃取我的数据库。
到目前为止,我的想法:
decoded
。
任何想法都会受到赞赏。
发布于 2010-11-14 17:47:52
我认为Alexa在标记中插入了随机标签,这给了我一段时间当我试图挖掘它时.他们在Alexa排名中添加了一些额外的标签,比如<span class="a5r">35</span><span class="et4">52</span><span class="arer">16</span>,除非你也下载了样式表并查看了呈现规则,否则你无法确定应该是哪个数字。
但是..。如果我有足够的耐心,我可以把数字“渲染”出来,然后挖掘出来,但这对我来说是不值得的。将页面请求限制在一个可能的人工数量上可能会很好(50/min或更多)。
发布于 2010-11-14 17:46:45
为什么人们会想偷你的数据库?他们这么做有什么关系呢?会否要求他们不要这样做?
使您的政策明确,并确保您的公司法律部门检查了措辞。阻止未经授权的联合,明确表示它是不允许的,并且你将采取法律措施来阻止它。
或者更好的是,鼓励授权的联合。只有在没有合理的方法以授权的方式进行时,人们才会进行未经授权的联合。
技术措施可能会产生一些效果,但只会吓阻那些没有特别能力或决心的人。
发布于 2010-11-14 17:48:54
你提出的解决方案都行不通。一个好的脚本作者可以很容易地绕过这些。但是,在应用服务器端有一个技术解决方案:实现一个速率限制。每10秒只允许从给定IP地址进行一次搜索。这将使自动数据挖掘从您的网站非常缓慢。
https://stackoverflow.com/questions/4178745
复制相似问题