首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Preg-Match分解html页面

使用Preg-Match分解html页面
EN

Stack Overflow用户
提问于 2014-02-11 23:55:57
回答 1查看 111关注 0票数 0

我目前得到一个包含谷歌排名靠前的网站数据的html页面,我需要分解的能力

代码语言:javascript
复制
<li class="g"><!--m--><div class="rc" data-hveid="74"><span class="altcts"></span><h3 class="r"><a href="http://airconditioning-london.co.uk/" onMouseDown="return rwt(this,'','','','2','AFQjCNH1BqTrwsbjky2ajPKpf01lUuU_JA','','0CEsQFjAB','','',event)"><em>Air Conditioning London</em> | Installation | Repairs | Maintenance |</a></h3><div class="s"><div><div class="f kv" style="white-space:nowrap"><cite class="vurls"><b>airconditioning</b>-<b>london</b>.co.uk/</cite>‎<div class="action-menu ab_ctl"><a class="clickable-dropdown-arrow ab_button" href="#" id="am-b1" aria-label="Result details" jsaction="ab.tdd;keydown:ab.hbke;keypress:ab.mskpe" aria-expanded="false" aria-haspopup="true" role="button" data-ved="0CEwQ7B0wAQ"><span class="mn-dwn-arw"></span></a><div class="action-menu-panel ab_dropdown" jsaction="keydown:ab.hdke;mouseover:ab.hdhne;mouseout:ab.hdhue" role="menu" tabindex="-1" data-ved="0CE0QqR8wAQ"><ul><li class="action-menu-item ab_dropdownitem" role="menuitem"><a class="fl" href="http://webcache.googleusercontent.com/search?q=cache:4BhUc7PZJMgJ:airconditioning-london.co.uk/+&amp;cd=2&amp;hl=en&amp;ct=clnk&amp;gl=uk" onMouseDown="return rwt(this,'','','','2','AFQjCNHtODEWSJL7iUlNPyYez6IpTq8vUQ','','0CE4QIDAB','','',event)">Cached</a></li><li class="action-menu-item ab_dropdownitem" role="menuitem"><a class="fl" href="/search?pws=1&amp;igu=1&amp;gl=GB&amp;gll=53.41058,-2.97794&amp;near=london&amp;q=related:airconditioning-london.co.uk/+air+conditioning+london&amp;tbo=1&amp;sa=X&amp;ei=jjj6UvCmBoyHrAe18oDwAQ&amp;ved=0CE8QHzAB">Similar</a></li></ul></div></div></div><div class="f slp"></div><span class="st"><em>Air Conditioning London</em>, We are London&#39;s best Cooling contractor. A specialist in Installation, Repairs, Service, Maintenance. Residential &amp; Commercial.</span></div></div></div><!--n--></li>

我需要能够获得以下信息,我相信PregMatch将是完成此任务的最佳方式;

标记文本-我需要此标记之间的文本< h3 >标记链接-我需要能够从h3标记文本周围的链接中获取H3 -我需要能够获取显示在H3标记中的文本

我希望有人能帮上忙。

提前感谢

EN

回答 1

Stack Overflow用户

发布于 2015-06-24 23:58:56

< h3 >中的文本

代码语言:javascript
复制
    $h3content = preg_replace('/<h3\b[^>]>(.*?)</h3>/', '$1', $source1);

    # link around the H3 < span class=st > ???
    # what you mean?

    # <span class="st"> text that shows in the span tag
    $spanContent = preg_replace('/<span\s+class="st"\b[^>]>(.*?)</span>/', '$1', $source1);
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21706678

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档