首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >BeautifulSoup soup.find标签

BeautifulSoup soup.find标签
EN

Stack Overflow用户
提问于 2018-11-22 12:36:15
回答 1查看 139关注 0票数 0

我试图解析一些页面,我只是没有得到一件事,我正在用类“寻呼机rel clr'”解析块"div“

代码语言:javascript
复制
pages=soup.find('div', class_='pager rel clr')

从这段代码中,我只需要解析href的页面链接

代码语言:javascript
复制
https://www.olx.pl/motoryzacja/samochody/volkswagen/golf/?page=2
https://www.olx.pl/motoryzacja/samochody/volkswagen/golf/?page=3
https://www.olx.pl/motoryzacja/samochody/volkswagen/golf/?page=4

下面是获取的html的不完整示例

代码语言:javascript
复制
<div class="pager rel clr">
<form action="" class="abs clr pagerGoToPage" id="pagerGoToPage" method="GET">
<span class="fnormal small fleft lheight24 pding0_5">Idź do strony:</span>
<fieldset class="fleft">
<input class="light lheight22 fleft tcenter br3 {currentPage: 1}" id="pageParam" maxlength="4" name="page" type="text" value="1"/>
<input name="search[filter_enum_model]" type="hidden" value="golf"/>
<input class="{totalPages: 219}" type="submit" value="OK"/>
</fieldset>
</form>
<span class="fbold prev abs large">
<span class="link pageNextPrev {page:0}" data-cy="page-link-prev"> <span>« poprzednia</span>
</span>
</span>
<span class="item fleft">
<span class="block br3 c41 large tdnone lheight24 current" data-cy="page-link-current"> <span>1</span>
</span>
</span>
<span class="item fleft">
<a class="block br3 brc8 large tdnone lheight24" data-cy="page-link-2" href="https://www.olx.pl/motoryzacja/samochody/volkswagen/golf/?page=2">
<span>2</span>
</a>
</span>
<span class="item fleft">
<a class="block br3 brc8 large tdnone lheight24" data-cy="page-link-3" href="https://www.olx.pl/motoryzacja/samochody/volkswagen/golf/?page=3">
<span>3</span>
</a>
</span>
<span class="item fleft">
<a class="block br3 brc8 large tdnone lheight24" data-cy="page-link-4" href="https://www.olx.pl/motoryzacja/samochody/volkswagen/golf/?page=4">
<span>4</span>
</a>
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-11-22 13:58:41

如果我看得清清楚楚,一旦你有了带着所有标签的漂亮汤,你就可以这样做。

代码语言:javascript
复制
for a in soup.find('div', class_='pager rel clr').find_all('a', href=True, class_="block br3 brc8 large tdnone lheight24"):
    print(a['href'])
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53431193

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档