文章/答案/技术大牛

发布

社区首页 >问答首页 >Craigslist、CURL、简单PHP DOM问题

问Craigslist、CURL、简单PHP DOM问题
EN

Stack Overflow用户

提问于 2010-08-09 13:38:56

回答 2查看 2.3K关注 0票数 1

我正在使用CURL登录Craigslist来抓取我发布的列表的状态。我遇到的问题是将HTML从CURL $output传输到file_get_html。虽然Craigslist的状态实际上是嵌套在TR元素中的，但我只是想测试一下最基本的函数，看看是否有东西通过(即链接抓取)。他们不是。

例如，这不起作用：

$cookie_file_path = getcwd()."/cookie.txt";

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://accounts.craigslist.org/login?LoginType=L&step=confirmation&originalURI=%2Flogin&rt=&rp=&inputEmailHandle='.$email.'&inputPassword='.$password.'&submit=Log%20In');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_REFERER, 'http://www.craigslist.org');

$agent = "Mozilla/5.0 (Windows; U; Windows NT 5.0; en-US; rv:1.4) Gecko/20030624 Netscape/7.1 (ax)";
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file_path);
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file_path);

$output = curl_exec($ch);
$info = curl_getinfo($ch);
curl_close($ch);
echo $output;

//

include_once('simple_html_dom.php');
$html = file_get_html($output);
//find all links
foreach($html->find('a') as $element)
       echo $element->href . '<br>';

我知道这个表达式是有效的，因为如果我输入'http://google.com‘或者其他什么东西，它就会返回链接。

html

dom

curl

craigslist

回答 2

Stack Overflow用户

发布于 2012-01-05 15:26:25

这就是应该怎么做的

$curl = curl_init(); 
curl_setopt($curl, CURLOPT_URL, 'http://www.sitename.com');  
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);  
curl_setopt($curl, CURLOPT_CONNECTTIMEOUT, 10);  
$str = curl_exec($curl);  
curl_close($curl);  

$html= str_get_html($str);

票数 1

Stack Overflow用户

发布于 2011-07-02 07:57:05

你不应该使用str_get_html而不是file_get_html吗？因为$ouput是一个字符串！

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/3437578

复制

相似问题

问Craigslist、CURL、简单PHP DOM问题
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Craigslist、CURL、简单PHP DOM问题EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Craigslist、CURL、简单PHP DOM问题
EN