首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用DOM和XPATH在具有多个类的html标记之间提取文本

使用DOM和XPATH在具有多个类的html标记之间提取文本
EN

Stack Overflow用户
提问于 2016-05-10 10:07:44
回答 1查看 437关注 0票数 0

我试图在一个HTML标记之间提取文本,但没有这样做:

要提取的文本(http://www.alexa.com/siteinfo/google.com)

代码语言:javascript
复制
<span class="font-4 box1-r">3,757,209</span>

PHP

代码语言:javascript
复制
$data = frontend::file_get_contents_curl('http://www.alexa.com/siteinfo/'.$domain); // custom function that return the HTML string
$dom = new DOMDocument();
$dom->loadHTML(htmlentities($data));
$xpath = new DOMXpath($dom);
$backlinks = $xpath->query('//span[@class="font-4 box1-r"]/text()');
var_dump($backlinks); // returns null
EN

回答 1

Stack Overflow用户

发布于 2016-05-10 11:05:03

为此,您可以使用simplehtmldom库(http://simplehtmldom.sourceforge.net/)。并将代码实现为:

代码语言:javascript
复制
require_once 'simplehtmldom/simple_html_dom.php';
$html = file_get_html('http://www.alexa.com/siteinfo/google.com');
echo $html->find('span.box1-r', 0)->plaintext;
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37135363

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档