首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >网站抓取: python请求没有下载完整的站点?

网站抓取: python请求没有下载完整的站点?
EN

Stack Overflow用户
提问于 2016-01-09 19:03:02
回答 1查看 1.6K关注 0票数 0

我在刮网站上有问题。其目的将是为伦敦的酒店节省一定时间的价格。为此,我将从booking.com加载下面的URL,然后尝试搜索关键字。但出于某种原因,requests.get并没有下载完整的站点。例如,下面的URL在我的浏览器中显示了一个酒店列表。他们中的每一个都显示了“总计”和价格。但是,在下面的代码中,site.find( 'Total‘)显示在字符串中找不到’Total‘这个词,尽管它在浏览器中是可见的。任何建议,为什么会发生这种情况,将受到赞赏。

代码语言:javascript
复制
import requests

url='http://www.booking.com/searchresults.en-gb.html?label=gen173nr-17CAEoggJCAlhYSDNiBW5vcmVmaFCIAQGYAS64AQTIAQTYAQHoAQH4AQs;sid=1a43e0952558ac0ad0061d5b6523a7bc;dcid=1;checkin_monthday=4;checkin_year_month=2016-2;checkout_monthday=11;checkout_year_month=2016-2;city=-2601889;class_interval=1;csflt=%7B%7D;group_adults=7;group_children=0;highlighted_hotels=1192837;hp_sbox=1;label_click=undef;no_rooms=1;review_score_group=empty;room1=A%2CA%2CA%2CA%2CA%2CA%2CA;sb_price_type=total;score_min=0;si=ai%2Cco%2Cci%2Cre%2Cdi;ss=London;ssafas=1;ssb=empty;ssne=London;ssne_untouched=London&;order=price_for_two'
r=requests.get(url)

site=r.text
site.find('Total')
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-01-09 19:08:51

您正在讨论的“总计”信息是在浏览器中使用Javascript生成的。请求库不能为您生成这个HTML,因为它不是一个浏览器环境。

要了解我在说什么,请尝试在没有Javascript的浏览器中运行该URL。

如果您想要抓取需要Javascript才能运行的HTML,您应该查看绑定到浏览器环境的库,比如

票数 7
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34697660

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档