首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何迭代div标记中的标记?

如何迭代div标记中的标记?
EN

Stack Overflow用户
提问于 2016-06-14 08:52:27
回答 1查看 54关注 0票数 2

我是BeautifulSoup的新手。下面是我感兴趣的html部分:

代码语言:javascript
复制
<div class="jpag" id="srchpagination"><a rel='prev' class="dis"><span>&lsaquo;&lsaquo;</span> Prev</a><span class="act">1</span><a 
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-2' >2</a><a href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-3' >3</a><a 
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-4' >4</a><a href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-5' >5</a><a 
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-6' >6</a><a href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-7' >7</a><a 
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-8' >8</a><a href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-9' >9</a><a 
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-10' >10</a><a rel='next' href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-2'>Next 
<span>&rsaquo;&rsaquo;</span></a></div>

我想检查'a‘标签中最后一个页码的值是否为10。

代码语言:javascript
复制
atags1=bSoup.find('div' ,attrs={'class' : 'jpag'})

现在,我想遍历'a‘标记,它没有像rel="prev“或rel="next”这样的属性,所以我将只使用页面号来遍历'a’标记。请帮我一把。提前谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-06-14 09:25:10

有很多种方法可以做到这一点,一种简单的方法是选择div中的锚并过滤任何具有rel攻击的内容:

代码语言:javascript
复制
html = """<div class="jpag" id="srchpagination"><a rel='prev' class="dis"><span>&lsaquo;&lsaquo;</span> Prev</a><span class="act">1</span><a
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-2' >2</a><a href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-3' >3</a><a
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-4' >4</a><a href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-5' >5</a><a
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-6' >6</a><a href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-7' >7</a><a
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-8' >8</a><a href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-9' >9</a><a
href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-10' >10</a><a rel='next' href='http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-2'>Next
<span>&rsaquo;&rsaquo;</span></a></div>"""

from bs4 import BeautifulSoup

soup = BeautifulSoup(html)

for a in soup.select("#srchpagination a[href]"):
    if not a.get("rel"):
        print(a)

这会让你:

代码语言:javascript
复制
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-2">2</a>
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-3">3</a>
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-4">4</a>
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-5">5</a>
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-6">6</a>
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-7">7</a>
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-8">8</a>
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-9">9</a>
<a href="http://www.justdial.com/Bangalore/Carpenters/ct-310711/page-10">10</a>
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37807252

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档