我正在尝试使用codeigniter和simplehtmldom实现一个爬虫。
$page = "URL to be Crawled";
$html = file_get_html($page);
$ad_description = $html->find('#ad_description',-1);
$description = $ad_description->innertext;$description包含多个连续的空格和换行符,我需要将它们转换为单一外观。
我试过了
str_replace("\n\r",' ',$description),
reduce_multiples($ad_description->innertext,"\r")
preg_replace("/[\r\n]+/", "\n", $description)
ascii_to_entities($description,ENT_HTML5, "ISO-8859-1")和许多其他可能的选择,但都没有成功。任何帮助都将不胜感激。
发布于 2015-07-20 13:56:05
我认为pref_replace确实起作用了
$description = "This
is a
test string
";
echo $description = preg_replace('/\s+/', ' ', $description); // This is a test string https://stackoverflow.com/questions/31504285
复制相似问题