首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用Scraping获取产品名称

使用Scraping获取产品名称
EN

Stack Overflow用户
提问于 2016-12-26 08:38:46
回答 3查看 794关注 0票数 0

下面是我的代码,以获得产品名称"RENU新鲜镜头解决方案120 ML“从url..this躺在p标签.我只需要这个名字。

代码语言:javascript
复制
import requests
import lxml
from bs4 import BeautifulSoup

url = "http://www.lenskart.com/renu-fresh-lens-solution-100-ml.html"

source = requests.get(url)
data = source.content
soup = BeautifulSoup(data, "lxml")

pn = soup.find_all("div", {"class":"prcdt-overview"})[0].text
print pn
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2016-12-26 10:35:21

代码语言:javascript
复制
import requests
from bs4 import BeautifulSoup

url = "http://www.lenskart.com/renu-fresh-lens-solution-100-ml.html"

source = requests.get(url)
# data = source.content   pass the variable in the BeautifulSoup()
soup = BeautifulSoup(source.content, "lxml")

查找()版本:

代码语言:javascript
复制
pn = soup.find('div', class_="prcdt-overview").p.text
  1. 您不需要导入'lxml',BeautifulSoup会帮您完成的
  2. 如果您只需要find_all()的第一个标记,则应该尝试find(),它将在find_all()中返回第一个标记
  3. 您可以使用tag.tag.find()/find_all()逐步获取标记。
  4. tag.tag_nametag.find('tag_name')的简称

CSS选择器版本:

代码语言:javascript
复制
soup.select_one(".prcdt-overview p").text
  1. select_one()将返回select()的第一个标记,如find()find_all()
票数 2
EN

Stack Overflow用户

发布于 2016-12-26 09:04:42

尝尝这个

代码语言:javascript
复制
pn = soup.select(".prcdt-overview h1[itemprop=name] p")[0].text

代码语言:javascript
复制
pn =soup.select(".prcdt-overview")[0].select("h1[itemprop=name]>p")[0].text

还有其他的方法,试试这些

希望这能有所帮助

票数 1
EN

Stack Overflow用户

发布于 2016-12-26 09:22:20

更详细的方式:

代码语言:javascript
复制
pn = soup.find_all("div", {"title":"prcdt-overview"})[0]
divTitle = pn.find("div",{"class":"title"})
pText = divTitle.find("p").text
print pText
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41328544

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档