下面是我在另一个文件中的代码
use Symfony\Component\DomCrawler\Crawler;
$guzzle = new GuzzleHttp\Client(['base_url' => 'http://pricematch.pk/mobile/samsung-galaxy-s6-80514-price-in-Pakistan']);
$response = $guzzle->get();
$crawler = new Crawler((string)$response->getBody());
echo $crawler->filter('.product-shop-wrapper .price')->text()."\r\n";其中的url是硬编码的,这个url成功地回显了过滤后的文本。当下面代码中的每个循环中相同的url /任何url来自一个变量时
$guzzle = new GuzzleHttp\Client(['base_url' => 'pricematch.pk/mobile-phone-prices-in-pakistan']);
$response = $guzzle->get();
$crawler = new Crawler((string)$response->getBody());
$crawler->filter('.product-name')->each(function ($node,$counter) {
echo $counter." ".$node->text()."\r\n";
$url=$node->filter('a')->extract(array('href'))[0]."\r\n";
echo $url."\r\n";
$url='http://pricematch.pk'.$url;
echo $url;
$guzzle = new GuzzleHttp\Client(['base_url' => $url]);
$response = $guzzle->get();
$crawler = new Crawler((string)$response->getBody());爬虫抛出一个异常,表示当前节点列表为空。href返回一个相对的url,我在上面的代码中添加了根url。我已经打印了很多次的结果url。即使url与code#1中的url相同,筛选器也会抛出异常。我做错了什么?
更新2:我刚刚发现code2爬虫中的数据来自
pricematch.pk/mobile-phone-prices-in-pakistan它应该从哪里来
这是怎么回事?
发布于 2015-01-15 19:55:14
愚蠢的我。在上面的代码中提取URL时,我将换行符连在一起,这个换行符可能编码了URL,在URL的末尾以__的形式出现,这基本上改变了URL,从而改变了响应。
https://stackoverflow.com/questions/27969561
复制相似问题