首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用python3创建web爬虫以从agoda获取多个页面

如何使用python3创建web爬虫以从agoda获取多个页面
EN

Stack Overflow用户
提问于 2016-10-19 18:48:58
回答 1查看 629关注 0票数 0

我是新来的。最近,我想从Agoda那里获得数据,我遇到了一个问题,就是agoda.com没有提供“下一页”的url(或href)。所以我不知道要改页。现在,我只从第1页得到数据,但我需要从page2,page3.有没有人帮我。我需要一些建议,工具或其他。顺便说一下,我使用python3和way 10。请帮助我,谢谢。下面是我现在的代码。

代码语言:javascript
复制
import requests
import pandas as pd

import csv
from bs4 import BeautifulSoup
from pandas import Series,DataFrame
import unicodecsv

def name1():
    url="https://www.agoda.com/zh-tw/pages/agoda/default/DestinationSearchResult.aspx?asq=%2bZePx52sg5H8gZw3pGCybdmU7lFjoXS%2baxz%2bUoF4%2bbAw3oLIKgWQqUpZ91GacaGdIGlJ%2bfxiotUg7cHef4W8WIrREFyK%2bHWl%2ftRKlV7J5kUcPb7NK6DnLacMaVs1qlGagsx8liTdosF5by%2fmvF3ZvJvZqOWnEqFCm0staf3OvDRiEYy%2bVBJyLXucnzzqZp%2fcBP3%2bKCFNOTA%2br9ARInL665pxj%2fA%2bylTfAGs1qJCjm9nxgYafyEWBFMPjt2sg351B&city=18343&cid=1732641&tag=41460a09-3e65-d173-1233-629e2428d88e&gclid=Cj0KEQjwvve_BRDmg9Kt9ufO15EBEiQAKoc6qlyYthgdt9CgZ7a6g6yijP42n6DsCUSZXvtfEJdYqiAaAvdW8P8HAQ&tick=636119092231&isdym=true&searchterm=%E5%A2%BE%E4%B8%81&pagetypeid=1&origin=TW&cid=1732641&htmlLanguage=zh-tw&checkIn=2016-10-20&checkOut=2016-10-21&los=1&rooms=1&adults=2&children=0&isFromSearchBox=true&ckuid=1b070b17-86c2-4376-a4f5-d3b98fc9cf45" 
    source_code=requests.get(url)                                         
    plain_text=source_code.text                                           
    soup=BeautifulSoup(plain_text,"lxml")                                        
    hotelname=soup.find_all("h3",{"class":"hotel-name"})
    f = csv.writer(open("test.csv", "w",newline=''))
    f.writerow(["hotelname","address"]) 
    p = []
    for N in hotelname:
        a=N.string.strip()
        f.writerow([a])
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-19 21:11:37

在浏览器开发工具中仔细检查单击“下一步”按钮会发生什么。

它有一个单击事件,它发送带有许多参数的xhr post请求。其中一个参数是PageNumber。参数的大多数值都很容易得到,可能除了您必须在页面上找到的SearchMessageID之外,或者是由javascript生成的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40139323

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档