我试着用不同的网页抓取一个叫iens的网站。现在我可以成功地抓取一页。
到目前为止,我的代码如下:
chrome_path = '/Users/username/Downloads/chromedriver'
driver = webdriver.Chrome(chrome_path)
url = 'https://www.iens.nl/restaurant'
pageExt = '#page='
restaurantList = []
cityList = ['utrecht']
def scrape(pageNumber):
driver.get(url + '+' + cityList[0] + pageExt + str(pageNumber))
items = driver.find_elements_by_class_name("resultItem-
information")
for item in items:
restaurantList.append(item.text)
return restaurantList
print scrape(14)这给了我所需要的结果。但是,当我想要抓取多个页面时,如下所示:
print scrape(12)
print scrape(14)我得到了网页12上数据的正确结果,但我没有得到网页14上的结果,而是得到了以下错误消息:
selenium.common.exceptions.StaleElementReferenceException: Message:
stale element reference: element is not attached to the page document该页面名为https://www.iens.nl/restaurant+utrecht
我可以请您帮个忙吗?
提前感谢!
发布于 2016-12-09 21:39:55
对于每个页面,这个问题似乎只随机重现一次。你能不能试一下这段代码,让我知道它是否像预期的那样工作:
import time
def scrape(pageNumber):
driver.get(url + '+' + cityList[0] + pageExt + str(pageNumber))
time.sleep(1)
items = driver.find_elements_by_class_name("resultItem-information")
for item in items:
restaurantList.append(item.text)https://stackoverflow.com/questions/41061547
复制相似问题