首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >终止cron作业任务

终止cron作业任务
EN

Stack Overflow用户
提问于 2016-10-07 10:39:42
回答 1查看 76关注 0票数 0

我目前正在使用cronjob每晚运行一个爬虫,它只能在晚上运行。但我发现有时数据量会很大,一夜之间不足以抓取所有东西。所以我必须在早上6:00结束这个过程如何使用cronjob终止爬虫进程?

EN

回答 1

Stack Overflow用户

发布于 2016-10-07 18:20:52

这取决于你用于抓取的是什么,但是使用持续运行的StormCrawler,你可以有一个cron作业通过调用'storm jar ...‘来启动抓取。命令和另一个用“暴风杀掉”来杀死它。使用Apache Nutch,您可以通过列出当前正在运行的hadoop作业并终止它来实现相同的功能。然而,让当前迭代完成,并在终止爬行之前解析和索引片段会更干净。同样,这取决于您使用的爬虫程序。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39908541

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档