首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何从HTML实体中删除多个空格和换行符

如何从HTML实体中删除多个空格和换行符
EN

Stack Overflow用户
提问于 2015-07-20 02:05:26
回答 1查看 396关注 0票数 1

我正在尝试使用codeigniter和simplehtmldom实现一个爬虫。

代码语言:javascript
复制
$page = "URL to be Crawled";
$html = file_get_html($page);
$ad_description = $html->find('#ad_description',-1);
$description = $ad_description->innertext;

$description包含多个连续的空格和换行符,我需要将它们转换为单一外观。

我试过了

代码语言:javascript
复制
str_replace("\n\r",' ',$description),
reduce_multiples($ad_description->innertext,"\r")
preg_replace("/[\r\n]+/", "\n", $description)
ascii_to_entities($description,ENT_HTML5, "ISO-8859-1")

和许多其他可能的选择,但都没有成功。任何帮助都将不胜感激。

EN

回答 1

Stack Overflow用户

发布于 2015-07-20 13:56:05

我认为pref_replace确实起作用了

代码语言:javascript
复制
$description = "This
is      a
test   string
";

echo $description = preg_replace('/\s+/', ' ', $description); // This is a test string 
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31504285

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档