首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >带标签的Goutte提取文本

带标签的Goutte提取文本
EN

Stack Overflow用户
提问于 2018-01-04 07:51:15
回答 1查看 2.8K关注 0票数 2

在尝试学习和使用Goutte搜索网站的描述时,它确实检索文本,但删除了所有标记(即<br><b>)。是否有方法检索div中所有文本的值,包括html标记?还是有一种更简单的替代方法能让我具备这种能力?

代码语言:javascript
复制
    <?php 
            require_once "vendor/autoload.php";
            use Goutte\Client;

            // Init. new client
            $client = new Client();
            $crawler = $client->request('GET', "examplesite.com/example");

            // Crawl response
            $description = $crawler->filter('element.class')->extract('_text');
    ?>
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-03-08 10:12:19

您可以使用html()功能

html

像这样

代码语言:javascript
复制
$descriptions = $crawler->filter('element.class')->each(function($node) {
    return $node->html();
})

在您可以使用strip_tags PHP函数清理它之后

http://php.net/manual/fr/function.strip-tags.php

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48090883

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档