文章/答案/技术大牛

发布

问带标签的Goutte提取文本
EN

Stack Overflow用户

提问于 2018-01-04 07:51:15

回答 1查看 2.8K关注 0票数 2

在尝试学习和使用Goutte搜索网站的描述时，它确实检索文本，但删除了所有标记(即<br><b>)。是否有方法检索div中所有文本的值，包括html标记？还是有一种更简单的替代方法能让我具备这种能力？

    <?php 
            require_once "vendor/autoload.php";
            use Goutte\Client;

            // Init. new client
            $client = new Client();
            $crawler = $client->request('GET', "examplesite.com/example");

            // Crawl response
            $description = $crawler->filter('element.class')->extract('_text');
    ?>

php

web-scraping

goutte

domcrawler

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-03-08 10:12:19

您可以使用html()功能

html

像这样

$descriptions = $crawler->filter('element.class')->each(function($node) {
    return $node->html();
})

在您可以使用strip_tags PHP函数清理它之后

http://php.net/manual/fr/function.strip-tags.php

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/48090883

复制

相似问题

问带标签的Goutte提取文本
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问带标签的Goutte提取文本EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问带标签的Goutte提取文本
EN