首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Python:使用bs4提取特定值

Python:使用bs4提取特定值
EN

Stack Overflow用户
提问于 2018-07-30 09:39:48
回答 1查看 77关注 0票数 0

HTML:

代码语言:javascript
复制
<div class="col-7"> 
    <dl class="row box">
        <h2>GENERAL</h2>
        <dt class="col-6">transmission:</dt>
        <dd class="col-6">sequential automatic</dd>
        <dt class="col-6 grey">number of seats:</dt>
        <dd class="col-6">5</dd>
        <dt class="col-6">first year of production:</dt>
        <dd class="col-6">2017</dd>
        <dt class="col-6 grey">last year of production:</dt>
        <dd class="col-6">available</dd>
    </dl>
        <dl class="row box">
        <h2>DRIVE</h2>
        <dt class="col-6">fuel:</dt>
        <dd class="col-6">petrol</dd>
        <dt class="col-6 grey">total maximum power:</dt>
        <dd class="col-6">147 kW (200 hp)</dd>
        <dt class="col-6">total maximum torque:</dt>
        <dd class="col-6">330 Nm</dd>
    </dl>
    <dl class="row box">
        <h2>TRANSMISSION</h2>
        <dt class="col-6">1st gear:</dt>
        <dd class="col-6">5,00:1</dd>
        <dt class="col-6 grey">2nd gear:</dt>
        <dd class="col-6">3,20:1</dd>
    </dl>
</div>

我的代码:

代码语言:javascript
复制
for item2 in soup2.find_all(attrs={'class':'col-7'}):
    jj=item2.text

jj可以从我抓取的网站中提取所有的值,但我只需要其中的几个值。例如,我只需要从一般情况下提取座位数和去年产量的值,以及从变速箱中提取第一档的值。

结果应该是:

代码语言:javascript
复制
5, available, 5,00:1
EN

回答 1

Stack Overflow用户

发布于 2018-07-30 10:10:51

您需要的信息只是标题“座位数”、“去年的产量”和“第一档”的下一项,因此您可以使用zip遍历该项和下一项

代码语言:javascript
复制
all_items = soup.find_all(attrs={'class':'col-6'})
titles = [
    "number of seats", 
    "last year of production", 
    "1st gear"
]
d = {title: [] for title in titles}

for item, next_item in zip(all_items, all_items[1:]):
    for title in titles:
        if title in item.text:
            d[title].append(next_item.text)
            break

然后,d将包含您需要的所有信息

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51586003

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档