问如何在Python中对嵌套列表进行How抓取？
EN

Stack Overflow用户

提问于 2022-05-11 21:11:15

回答 1查看 77关注 0票数 -2

网站链接：https://www.zivame.com/rosaline-chromaticity-knit-cotton-top-florida-key.html?trksrc=category&trkid=search&trkorder=relevance

我想刮的是:短袖风格，轻松舒适(基本上就是下面描述的要点)。

这是我目前使用的代码：

from selenium import webdriver
import re
from bs4 import BeautifulSoup
import requests

result = requests.get("https://www.zivame.com/rosaline-chromaticity-knit-cotton-top-florida-key.html?trksrc=category&trkid=search&trkorder=relevance")

soup = BeautifulSoup(result.text, 'lxml')
page = soup.find('div', id="product-page")
description = page.find('div', id="product-basicdetail")
point1 = description.find('div', id="ff-rm text-size pd-b5")
print(point1)

web-scraping

python

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-05-11 21:39:25

数据以JSON数据的形式出现，您可以直接从源页面抓取数据。

import requests
from lxml import html

r = requests.get('https://www.zivame.com/rosaline-chromaticity-knit-cotton-top-florida-key.html?trksrc=category&trkid=search&trkorder=relevance')
source_page = html.fromstring(r.text)
json_value = source_page.xpath("//script[contains(.,'window.__product=')]/text()")[0]
json_value = json_value.split("{features:{values:[{list:[")[1].split("]}],count:1}}},modelMetaData:")[0]
print(json_value.split(','))

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72207634

复制

相似问题

问如何在Python中对嵌套列表进行How抓取？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在Python中对嵌套列表进行How抓取？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在Python中对嵌套列表进行How抓取？
EN