首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在Python中对嵌套列表进行How抓取?

如何在Python中对嵌套列表进行How抓取?
EN

Stack Overflow用户
提问于 2022-05-11 21:11:15
回答 1查看 77关注 0票数 -2

网站链接:https://www.zivame.com/rosaline-chromaticity-knit-cotton-top-florida-key.html?trksrc=category&trkid=search&trkorder=relevance

我想刮的是:短袖风格,轻松舒适(基本上就是下面描述的要点)。

这是我目前使用的代码:

代码语言:javascript
复制
from selenium import webdriver
import re
from bs4 import BeautifulSoup
import requests

result = requests.get("https://www.zivame.com/rosaline-chromaticity-knit-cotton-top-florida-key.html?trksrc=category&trkid=search&trkorder=relevance")

soup = BeautifulSoup(result.text, 'lxml')
page = soup.find('div', id="product-page")
description = page.find('div', id="product-basicdetail")
point1 = description.find('div', id="ff-rm text-size pd-b5")
print(point1)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-05-11 21:39:25

数据以JSON数据的形式出现,您可以直接从源页面抓取数据。

代码语言:javascript
复制
import requests
from lxml import html

r = requests.get('https://www.zivame.com/rosaline-chromaticity-knit-cotton-top-florida-key.html?trksrc=category&trkid=search&trkorder=relevance')
source_page = html.fromstring(r.text)
json_value = source_page.xpath("//script[contains(.,'window.__product=')]/text()")[0]
json_value = json_value.split("{features:{values:[{list:[")[1].split("]}],count:1}}},modelMetaData:")[0]
print(json_value.split(','))
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72207634

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档