文章/答案/技术大牛

发布

社区首页 >问答首页 >调整Craigslist刮板Python

问调整Craigslist刮板Python
EN

Stack Overflow用户

提问于 2017-06-22 06:24:15

回答 1查看 215关注 0票数 0

我正在尝试修改我在网上找到的python2.7Craigslist刮板，使其与python3.6一起工作。

但每次我运行python脚本时，它都不返回任何内容。是不是因为我没有瞄准正确的html标签？如果是这样，我该如何定位正确的html标记呢？

我假设它是下面这部分代码：

    for listing in soup.find_all('p',{'class':'result-row'}):
    if listing.find('span',{'class':'result-price'}) != None:

完整的脚本如下。

提前谢谢你。

import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin

URL = 'https://vancouver.craigslist.ca/search/sss?query=Vespa'
BASE = 'https://vancouver.craigslist.ca/'

response = requests.get(URL)

soup = BeautifulSoup(response.content,"html.parser")
for listing in soup.find_all('p',{'class':'result-row'}):
    if listing.find('span',{'class':'result-price'}) != None:
        price = listing.text[2:6]
        price = int(price)
        if price <=3600 and price > 1000:
            print (listing.text)
            link_end = listing.a['href']
            url = urljoin(BASE, link_end)
            print (url)
            print ("\n")
print('test')

list

python-3.x

automation

craigslist

回答 1

Stack Overflow用户

发布于 2017-06-22 15:01:24

你是对的，这是可能的问题：

 for listing in soup.find_all('p',{'class':'result-row'}):
    if listing.find('span',{'class':'result-price'}) != None:

这篇文章必须针对你正在抓取的特定网页进行编辑。您是否查看了页面的HTML并验证了这两行？如果没有，用鼠标右键点击页面并选择“查看页面源代码”。然后你必须找到你想要抓取的特定数据。

如果我想从html中的网页中抓取一些东西：

<div class='what'>hello</div>

我将上面的代码更改为：

for listing in soup.find_all('div',{'class':'what'}):
     # do something

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44687195

复制

相似问题

问调整Craigslist刮板Python
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问调整Craigslist刮板PythonEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问调整Craigslist刮板Python
EN