我想从这个url获取<td valign="top" class="notizia_testo"></td>之间的文本
http://www.ladige.it/news/2008_lay_notizia_01.php?id_cat=4&id_news=100152
我尝试了simple html dom和php regular-expression,但是什么也没有返回。我检查了html原始代码,并将它们复制为:
<?php
$str = <<<EOT
//all the html raw code
EOT;
preg_match_all("|<td valign=\"top\" class=\"notizia_testo\">([^^]*?)</td>|u", $str, $matches1);
print_r($matches1);
?>我最终发现故障可能是由以下原因引起的:
line 762 <!?php include($_SERVER["DOCUMENT_ROOT"]."/include/adv/manzoni_bigrect.php"); ?>如何通过这条线并为我工作?谢谢。
发布于 2011-03-14 18:44:59
您只需使用simple_html_dom即可获得结果,如下所示:
require 'simplehtmldom/simple_html_dom.php';
$data = file_get_contents('http://www.ladige.it/news/2008_lay_notizia_01.php?id_cat=4&id_news=100152');
$oHTML = str_get_html($data);
$oTDs = $oHTML->find('table tr td.notizia_testo');
$result = array();
foreach($oTDs as $oTD) {
$result[] = trim($oTD->plaintext);
}
echo "<pre>";
var_dump($result);
echo "</pre>";https://stackoverflow.com/questions/5296991
复制相似问题