文章/答案/技术大牛

发布

社区首页 >问答首页 >PHPCrawl可以用于抓取网站吗?与Scrapy有何不同？

问PHPCrawl可以用于抓取网站吗?与Scrapy有何不同？
EN

Stack Overflow用户

提问于 2012-11-22 13:06:28

回答 2查看 783关注 0票数 0

我想刮几个网站，很多人建议使用Scrapy。它是基于Python的，因为我非常熟悉PHP，所以我寻找了替代方案。

我得到了一个爬虫PHPCrawl。我不确定它是否只是一个爬虫，或者它也会提供抓取功能。如果它可以用于抓取-它将支持XPath或正则表达式。

它怎么能和Python上的Scrapy相比呢？

请建议我哪一个是最好的用来抓取网站。

谢谢

web-scraping

web-crawler

scrapy

phpcrawl

xpath

回答 2

Stack Overflow用户

回答已采纳

发布于 2012-11-23 16:18:01

PHPCrawl是一个纯粹的爬虫，它把找到的页面和它们的源代码“原样”地传递给用户(连同一些上下文信息)。因此，它是快速的，它能够使用多进程，并有大量的选项来配置它。

关于Scrapy我不能说太多，因为我到目前为止还没有用过它。

票数 0

Stack Overflow用户

发布于 2012-11-23 20:52:16

是的，当然。但正如我所说的，PHPCrawl提供了页面源代码，您必须从中提取您想要提取的数据。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/13506216

复制

相似问题

问PHPCrawl可以用于抓取网站吗?与Scrapy有何不同？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问PHPCrawl可以用于抓取网站吗?与Scrapy有何不同？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问PHPCrawl可以用于抓取网站吗?与Scrapy有何不同？
EN