文章/答案/技术大牛

发布

社区首页 >问答首页 >用于抓取Web抓取的CSS选择器

问用于抓取Web抓取的CSS选择器
EN

Stack Overflow用户

提问于 2018-06-07 08:22:56

回答 1查看 2.1K关注 0票数 0

我现在正在搜索网站上列出的所有购物中心

https://web.archive.org/web/20151112172204/http://www.simon.com/mall

使用Python和Scrapy。我想不出怎么提取文本“安克雷奇第五大道购物中心”。

<div class="st-country-padding">
    <h4><a class="no-underline" href="/web/20151112172204/http://www.simon.com/search/alaska%2b(ak)" title="View Malls In Alaska">Alaska</a></h4>
        <div>
            <a href="/web/20151112172204/http://www.simon.com/search/anchorage,+ak" title="Malls in Anchorage, AK">Anchorage</a>:
                <a href="http://www.simon.com/mall/anchorage-5th-avenue-mall" title="View Anchorage 5th Avenue Mall Website">Anchorage 5th Avenue Mall</a>
        </div>
</div>

我尝试了许多不同的尝试，包括

response.css("a::attr(title)").extract()

但没有给我想要的东西。

请注意，Anchorage只是第一个商场的名称，所以我不能直接调用它，因为有大约200个不同的商场

html

python-3.x

web-scraping

scrapy

css-selectors

回答 1

Stack Overflow用户

发布于 2018-06-07 08:46:47

::attr(title)为您提供title属性的值。您需要的是文本，因此需要使用::text。

此外，似乎没有一种很好的方法来标识您想要的a元素，因为它没有任何区别于其他元素的东西，所以需要一些路径。如果这对你有效，请告诉我：

response.css(".st-country-padding > div > a:last-of-type::text").extract()

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50731368

复制

相似问题

问用于抓取Web抓取的CSS选择器
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于抓取Web抓取的CSS选择器EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于抓取Web抓取的CSS选择器
EN