这个问题是我上一个问题(硒中)的后续问题。我正在从grailed.com (https://www.grailed.com/designers/jordan-brand/hi-top-sneakers)中抓取所有的Air数据。我正在将大小、模型、url和图像url存储在对象中。我目前有一个程序,它可以滚动整个提要并获取所有这些。除了找到图像url外,一切都正常工作。图像URL似乎需要显式的等待,@KunduK建议这样做。我正在尝试实现他的解决方案,以便能够在for循环中提取每个映像:
while True and len(sneakers) < sneaker_count:
driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
# Get sneakers currently on page and add to sneakers list
feed = driver.find_elements_by_class_name('feed-item')
images = WebDriverWait(driver, 10).until(
EC.visibility_of_all_elements_located((By.CSS_SELECTOR, ".feed-item .listing-cover-photo>img")))
for item in feed:
...当前,代码会同时获取组中的图像。我试图在“在提要中的项目”块中获取图像。我想要一些类似images = WebDriverWait(driver, 10).until(EC.visibility_of_elements_located((By.SOME SELECTOR", ???)))的东西,但是我真的不知道如何使用'item‘元素来找到这些元素。有人能帮忙吗?
发布于 2020-06-24 19:53:16
要使用硒和python从每个映像中刮取图像url,您必须为visibility_of_all_elements_located()诱导WebDriverWait,您可以使用以下任何一个定位器策略
CSS_SELECTOR:
20).until(EC.visibility_of_all_elements_located((By.CSS_SELECTOR,driver.get(‘https://www.grailed.com/designers/jordan-brand/hi-top-sneakers'’)打印(my_elem.get_attribute(“href”)用于my_elem in WebDriverWait(驱动程序,a产品卡-容器)XPATH:
driver.get('https://www.grailed.com/designers/jordan-brand/hi-top-sneakers')打印([my_elem.get_attribute(“href”)表示my_elem in WebDriverWait(驱动程序,WebDriverWait“//a class=‘product card-my_elem’”)https://stackoverflow.com/questions/62560395
复制相似问题