我试图在div标记声明中提取一些内容:
<div class="search-listing font-size-10 my-3 my-md-0 py-0 py-md-4" listing_id="5327969" latitude="28.92327" longitude="-27.0365">
.
.
.
</div>我想要的是经纬度。但我似乎无法访问div声明本身中的内容。我只能进入孩子们的物品。我用的是html.parser
如果我试着做:
line.select('div[class*py-md-4"]')[0]) 我得到了一个索引错误。
这是行不通的:
coords = soup.find_all("longitude")我试过:
divisions = soup.select('div[class*=search-listing]')
for line in divisions:
print(line.select('div[class*=py-md-4]')[0])但每次我试着从线上提取项目-它给我的孩子的div。
我希望能够从分区中提取出经度和纬度,但都没有用。这肯定是可能的吗?
发布于 2019-07-31 18:18:09
您可以使用CSS选择器[latitude][longitude]。这将选择每个已定义属性latitude=、和 longitude=的标记。
data = '''<div class="search-listing font-size-10 my-3 my-md-0 py-0 py-md-4" listing_id="5327969" latitude="28.92327" longitude="-27.0365">
<p>Some text</p>
</div>'''
from bs4 import BeautifulSoup
soup = BeautifulSoup(data, 'html.parser')
for tag in soup.select('[latitude][longitude]'):
print('lat={} lon={}'.format(tag['latitude'], tag['longitude']))指纹:
lat=28.92327 lon=-27.0365进一步读:
https://stackoverflow.com/questions/57296716
复制相似问题