首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >安排scrapy爬虫每N分钟运行一次

安排scrapy爬虫每N分钟运行一次
EN

Stack Overflow用户
提问于 2017-07-12 16:55:50
回答 1查看 770关注 0票数 3

我需要帮助来安排我的爬虫每N分钟运行一次。早些时候,我看到大多数人使用reactor.callLaterreactor.run来达到这个目的,但现在似乎没有可能使用这些功能了。我怎么才能有计划地安排它呢?

代码语言:javascript
复制
def run_crawl():
    """
    Run a spider within Twisted. Once it completes,
    wait 5 seconds and run another spider.
    """
    runner = CrawlerRunner(get_project_settings())
    runner.crawl(SpiderA)
    runner.crawl(SpiderB)
    deferred = runner.join()
    deferred.addCallback(reactor.callLater, 5, run_crawl)
    return deferred

run_crawl()
reactor.run()

目前,我的爬虫程序是由Windows任务调度程序调度的,但我想以编程方式调度它。

EN

回答 1

Stack Overflow用户

发布于 2017-07-12 18:25:45

您可以尝试使用名为schedule的外部模块:

schedule github link

如果它不符合你的需要,请告诉我。

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45052965

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档