首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >抓取图片的url

抓取图片的url
EN

Stack Overflow用户
提问于 2016-03-09 23:36:57
回答 1查看 4.1K关注 0票数 3

如何使用python.please帮助me.this中的scrapy从网站获取图像url是我的代码

代码语言:javascript
复制
from scrapy.spiders import CrawlSpider, Rule
#from scrapy.linkextractors.lxmlhtml import LxmlLinkExtractor
from scrapy.contrib.linkextractors import LinkExtractor
from scrapy.item import Item, Field

class MyItem(Item):
    url= Field()


class someSpider(CrawlSpider):
    name = 'crawltest'
    allowed_domains = ['bambeeq.com']
    start_urls = ['http://www.bambeeq.com/']
    rules = (Rule(LinkExtractor(allow=()), callback='parse_obj', follow=True),)

    def parse_obj(self,response):
        item = MyItem()
        item['url'] = []
        for link in LinkExtractor(allow=(),deny = self.allowed_domains).extract_links(response):
            item['url'].append(link.url)
            #item['image'].append(link.img)
        return item
EN

回答 1

Stack Overflow用户

发布于 2016-03-10 00:57:32

您提取的是链接('a‘元素),而不是图像('img’元素)。试试这个:

代码语言:javascript
复制
# iterate over the list of images
for image in response.xpath('//img/@src').extract():
    # make each one into a full URL and add to item[]
    item['url'].append(response.urljoin(image))

yield item
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35896008

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档