首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Guzzle Http客户端模糊响应

Guzzle Http客户端模糊响应
EN

Stack Overflow用户
提问于 2015-01-15 17:37:32
回答 1查看 404关注 0票数 2

下面是我在另一个文件中的代码

代码语言:javascript
复制
use Symfony\Component\DomCrawler\Crawler;
$guzzle = new GuzzleHttp\Client(['base_url' => 'http://pricematch.pk/mobile/samsung-galaxy-s6-80514-price-in-Pakistan']);
$response = $guzzle->get();
$crawler = new Crawler((string)$response->getBody());
echo $crawler->filter('.product-shop-wrapper .price')->text()."\r\n";

其中的url是硬编码的,这个url成功地回显了过滤后的文本。当下面代码中的每个循环中相同的url /任何url来自一个变量时

代码语言:javascript
复制
$guzzle = new GuzzleHttp\Client(['base_url' => 'pricematch.pk/mobile-phone-prices-in-pakistan']);

$response = $guzzle->get();

$crawler = new Crawler((string)$response->getBody());
$crawler->filter('.product-name')->each(function ($node,$counter) {
    echo $counter." ".$node->text()."\r\n";
    $url=$node->filter('a')->extract(array('href'))[0]."\r\n";
    echo $url."\r\n";
    $url='http://pricematch.pk'.$url;
    echo $url;
    $guzzle = new GuzzleHttp\Client(['base_url' => $url]);
    $response = $guzzle->get();
    $crawler = new Crawler((string)$response->getBody());

爬虫抛出一个异常,表示当前节点列表为空。href返回一个相对的url,我在上面的代码中添加了根url。我已经打印了很多次的结果url。即使url与code#1中的url相同,筛选器也会抛出异常。我做错了什么?

更新2:我刚刚发现code2爬虫中的数据来自

代码语言:javascript
复制
pricematch.pk/mobile-phone-prices-in-pakistan

它应该从哪里来

这是怎么回事?

EN

回答 1

Stack Overflow用户

发布于 2015-01-15 19:55:14

愚蠢的我。在上面的代码中提取URL时,我将换行符连在一起,这个换行符可能编码了URL,在URL的末尾以__的形式出现,这基本上改变了URL,从而改变了响应。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/27969561

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档