我想在下面的标签中找到内容:
<h4 id="rfq-info-header-id" class="pr-3 mb-3">
RFQ1526090
</h4>

完整代码:
<rfq-display-header-seller>
<div class="card-body pb-0">
<div class="row">
<div id="rfq-info-header-col-1" class="col-xs-12 col-sm-12 col-md-12 col-lg-6">
<div class="small text-muted">RFQ ID</div>
<h4 id="rfq-info-header-id" class="pr-3 mb-3">
RFQ1526090
</h4>我试过了:
rfq_id = [tag.text.strip() for tag in soup.find_all(name='h4', attrs={'id': 'rfq-info-header-id','class': 'pr-3 mb-3'})]
print(rfq_id)但这会导致列表[]为空。这是因为h4标记在许多标记中吗?如何简化上述代码中提取标记内部数据的代码
发布于 2021-10-21 08:11:18
我得到的输出如下:
from bs4 import BeautifulSoup
html_doc="""
<rfq-display-header-seller>
<div class="card-body pb-0">
<div class="row">
<div id="rfq-info-header-col-1" class="col-xs-12 col-sm-12 col-md-12 col-lg-6">
<div class="small text-muted">RFQ ID</div>
<h4 id="rfq-info-header-id" class="pr-3 mb-3">
RFQ1526090
</h4>
"""
soup = BeautifulSoup(html_doc, 'html.parser')
# rfq_id = soup.find('h4').text
# print(rfq_id)
rfq_id = [t.get_text(strip=True) for t in soup.find_all('h4')]
print(rfq_id)输出:
['RFQ1526090']仅使用find方法输出:
RFQ1526090https://stackoverflow.com/questions/69656353
复制相似问题