我试图从一个网站的一些网页上删除内容。我用c#尝试了html-agility-pack,它在抓取html.Here方面做得很好,我需要在抓取时浏览一些页面。现在我的问题是,我如何才能隐藏我自己的网络摩天大楼?因为我不想让其他人知道我正在窃取他们的content.Please,请让我知道是否有任何方法可以帮助me.Looking转发您的回复。
谢谢
发布于 2014-04-25 00:52:17
使用tor代理:
您可以在每个页面或每个站点之后重置代理。请记住,有些网站会寻找特定的模式,并能告诉你正在抓取它们。使用html agility pack,web是一个大数据存储库,只要确保你不会以一种会给你带来麻烦的方式使用别人的数据即可。
https://stackoverflow.com/questions/23020012
复制相似问题