文章/答案/技术大牛

发布

社区首页 >问答首页 >Guzzle Http客户端模糊响应

问Guzzle Http客户端模糊响应
EN

Stack Overflow用户

提问于 2015-01-15 17:37:32

回答 1查看 404关注 0票数 2

下面是我在另一个文件中的代码

use Symfony\Component\DomCrawler\Crawler;
$guzzle = new GuzzleHttp\Client(['base_url' => 'http://pricematch.pk/mobile/samsung-galaxy-s6-80514-price-in-Pakistan']);
$response = $guzzle->get();
$crawler = new Crawler((string)$response->getBody());
echo $crawler->filter('.product-shop-wrapper .price')->text()."\r\n";

其中的url是硬编码的，这个url成功地回显了过滤后的文本。当下面代码中的每个循环中相同的url /任何url来自一个变量时

$guzzle = new GuzzleHttp\Client(['base_url' => 'pricematch.pk/mobile-phone-prices-in-pakistan']);

$response = $guzzle->get();

$crawler = new Crawler((string)$response->getBody());
$crawler->filter('.product-name')->each(function ($node,$counter) {
    echo $counter." ".$node->text()."\r\n";
    $url=$node->filter('a')->extract(array('href'))[0]."\r\n";
    echo $url."\r\n";
    $url='http://pricematch.pk'.$url;
    echo $url;
    $guzzle = new GuzzleHttp\Client(['base_url' => $url]);
    $response = $guzzle->get();
    $crawler = new Crawler((string)$response->getBody());

爬虫抛出一个异常，表示当前节点列表为空。href返回一个相对的url，我在上面的代码中添加了根url。我已经打印了很多次的结果url。即使url与code#1中的url相同，筛选器也会抛出异常。我做错了什么？

更新2：我刚刚发现code2爬虫中的数据来自

pricematch.pk/mobile-phone-prices-in-pakistan

它应该从哪里来

这是怎么回事？

php

symfony

web-scraping

guzzle

回答 1

Stack Overflow用户

发布于 2015-01-15 19:55:14

愚蠢的我。在上面的代码中提取URL时，我将换行符连在一起，这个换行符可能编码了URL，在URL的末尾以__的形式出现，这基本上改变了URL，从而改变了响应。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/27969561

复制

相似问题

问Guzzle Http客户端模糊响应
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Guzzle Http客户端模糊响应EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Guzzle Http客户端模糊响应
EN