首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >网络抓取功能TripAdvisor

网络抓取功能TripAdvisor
EN

Stack Overflow用户
提问于 2021-04-22 00:39:42
回答 1查看 77关注 0票数 0

我正试图在上搜索关于我所在城市(巴西利亚- https://www.tripadvisor.com.br/Hotels-g303322-Brasilia_Federal_District-Hotels.html)的酒店的TripAdvisor网站。然后,我想刮一下酒店的特色,比如(免费Wifi (Wifi),Piscina (游泳池)等等),但是我的代码是把所有的功能都分开了。总共有30家酒店,最后,我得到了61个功能,因为我的代码不能将这些连接起来作为相应的酒店名称。

代码语言:javascript
复制
import requests
from bs4 import BeautifulSoup as soup

html = requests.get('https://www.tripadvisor.com.br/Hotels-g303322-Brasilia_Federal_District-Hotels.html')

bsobj = soup(html.content, 'lxml')

hotel = []
for name in bsobj.findAll('div', {'class':'listing_title'}):
    hotel.append(name.text.strip())
hotel #30 Hotel

caracteristicas = []
for caracteristica in bsobj.findAll('span', {'class':'text'}):
    caracteristicas.append(caracteristica.text.strip())
caracteristicas #61 features (caracteristicas)

谁能给我个提示吗?

EN

回答 1

Stack Overflow用户

发布于 2021-04-22 02:20:23

尝试迭代这个主div,然后从这里提取酒店的名称和便利设施:

代码语言:javascript
复制
<div class="prw_rup prw_meta_hsx_responsive_listing ui_section listItem" data-prwidget-name="meta_hsx_responsive_listing" data-prwidget-init="handlers" data-no-pt-mw="true" data-mlv="true">
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67205225

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档