blocks|key|1732809|text|您可以使用ERRORCOUNT|type|unstyled|depth|inlineStyleRanges|entityRanges|offset|length|data|1732810|一个整数，它指定关闭蜘蛛之前要接收的最大错误数。如果爬行器生成的错误超过这个数目，它将以closespider_errorcount的原因关闭。如果为零(或未设置)，则蜘蛛不会因错误数而关闭。|blockquote|1732811|默认情况下，它被设置为0+CLOSESPIDER_ERRORCOUNT+=+0，如果您想在第一个错误发生时退出，您可以将更改为1。|style|CODE|BOLD|1732812|更新|1732813|阅读这个问题的答案，您还可以使用：|1732814|crawler.engine.close_spider(self,+'log+message')|code-block|syntax|javascript|1732815|欲了解更多信息，请阅读：|1732816|闭蜘蛛延伸|1732817|entityMap|0|LINK|mutability|MUTABLE|url|https://doc.scrapy.org/en/latest/topics/extensions.html#closespider-errorcount|1|https://stackoverflow.com/questions/9524923/how-can-i-make-scrapy-crawl-break-and-exit-when-encountering-the-first-exception|2|https://scrapy.readthedocs.io/en/0.12/topics/extensions.html#module-scrapy.contrib.closespider^0|5|A|0|0|0|D|Q|1N|1|1R|1|0|0|2|0|2|4|1|0|0|0|0|5|2|0^^$0|@$1|2|3|4|5|6|7|1A|8|@]|9|@$A|1B|B|1C|1|1D]]|C|$]]|$1|D|3|E|5|F|7|1E|8|@]|9|@]|C|$]]|$1|G|3|H|5|6|7|1F|8|@$A|1G|B|1H|I|J]|$A|1I|B|1J|I|K]|$A|1K|B|1L|I|K]]|9|@]|C|$]]|$1|L|3|M|5|6|7|1M|8|@$A|1N|B|1O|I|K]]|9|@]|C|$]]|$1|N|3|O|5|6|7|1P|8|@]|9|@$A|1Q|B|1R|1|1S]]|C|$]]|$1|P|3|Q|5|R|7|1T|8|@]|9|@]|C|$S|T]]|$1|U|3|V|5|6|7|1U|8|@]|9|@]|C|$]]|$1|W|3|X|5|6|7|1V|8|@]|9|@$A|1W|B|1X|1|1Y]]|C|$]]|$1|Y|3|-4|5|6|7|1Z|8|@]|9|@]|C|$]]]|Z|$10|$5|11|12|13|C|$14|15]]|16|$5|11|12|13|C|$14|17]]|18|$5|11|12|13|C|$14|19]]]]

You can use <a href="https://doc.scrapy.org/en/latest/topics/extensions.html#closespider-errorcount" rel="noreferrer">CLOSESPIDER_ERRORCOUNT</a>

<blockquote>
 An integer which specifies the maximum number of errors to receive
 before closing the spider. If the spider generates more than that
 number of errors, it will be closed with the reason
 closespider_errorcount. If zero (or non set), spiders won’t be closed
 by number of errors.
</blockquote>

By default it is set to 0
<code>CLOSESPIDER_ERRORCOUNT = 0</code>
you can change it to 1 if you want to exit when you have the first error. 

UPDATE

Read the answers of <a href="https://stackoverflow.com/questions/9524923/how-can-i-make-scrapy-crawl-break-and-exit-when-encountering-the-first-exception">this question</a>, you can also use:

<pre><code>crawler.engine.close_spider(self, 'log message')
</code></pre>

for more information read :

<a href="https://scrapy.readthedocs.io/en/0.12/topics/extensions.html#module-scrapy.contrib.closespider" rel="noreferrer">Close spider extension</a>

blocks|key|394255|text|在您的蜘蛛的process_item函数中，有一个spider实例。|type|unstyled|depth|inlineStyleRanges|offset|length|style|BOLD|CODE|entityRanges|data|394256|为了解决您的问题，您可以在插入数据时捕获异常，然后，如果您捕捉到这样的意外情况，则可以整齐地阻止您的蜘蛛：|394257|+def+process_item(self,+item,+spider):
++++try:
++++++++#Insert+your+item+here
++++except+YourExceptionName:
++++++++spider.crawler.engine.close_spider(self,+reason='finished')|code-block|syntax|javascript|394258|entityMap^0|6|C|P|6|0|K|2|0|0^^$0|@$1|2|3|4|5|6|7|P|8|@$9|Q|A|R|B|C]|$9|S|A|T|B|D]]|E|@]|F|$]]|$1|G|3|H|5|6|7|U|8|@$9|V|A|W|B|C]]|E|@]|F|$]]|$1|I|3|J|5|K|7|X|8|@]|E|@]|F|$L|M]]|$1|N|3|-4|5|6|7|Y|8|@]|E|@]|F|$]]]|O|$]]

In the process_item function of your spider you have an instance of <code>spider</code>.

To solve your problem you could catch the exceptions when you insert your data, then neatly stop you spider if you catch a certain exeption like this:

<pre><code> def process_item(self, item, spider):
 try:
 #Insert your item here
 except YourExceptionName:
 spider.crawler.engine.close_spider(self, reason='finished')
</code></pre>

blocks|key|394228|text|我不知道有什么设置会在任何例外情况下关闭爬行器，但是您至少有几个选项：|type|unstyled|depth|inlineStyleRanges|entityRanges|data|394229|您可以在蜘蛛回调中引发CloseSpider异常，也许当您捕捉到提到的异常时|unordered-list-item|offset|length|style|CODE|394230|如果有对爬虫和蜘蛛对象的引用(例如，在扩展中)，则可以调用crawler.engine.close_spider(spider,+'some+reason')。请参见扩展实现+(它与CloseSpider异常不一样)。例如，您可以将其与spider_error信号挂钩。|394231|entityMap|0|LINK|mutability|MUTABLE|url|https://doc.scrapy.org/en/latest/topics/exceptions.html?#closespider|1|https://github.com/scrapy/scrapy/blob/129421c7e31b89b9b0f9c5f7d8ae59e47df36091/scrapy/extensions/closespider.py#L61|2|https://doc.scrapy.org/en/latest/topics/signals.html#spider-error^0|0|B|B|B|B|0|0|T|1E|2J|B|3A|C|2B|4|1|3A|C|2|0^^$0|@$1|2|3|4|5|6|7|W|8|@]|9|@]|A|$]]|$1|B|3|C|5|D|7|X|8|@$E|Y|F|Z|G|H]]|9|@$E|10|F|11|1|12]]|A|$]]|$1|I|3|J|5|D|7|13|8|@$E|14|F|15|G|H]|$E|16|F|17|G|H]|$E|18|F|19|G|H]]|9|@$E|1A|F|1B|1|1C]|$E|1D|F|1E|1|1F]]|A|$]]|$1|K|3|-4|5|6|7|1G|8|@]|9|@]|A|$]]]|L|$M|$5|N|O|P|A|$Q|R]]|S|$5|N|O|P|A|$Q|T]]|U|$5|N|O|P|A|$Q|V]]]]

I don't know of a setting that would close the crawler on any exception, but you have at least a couple of options:

<ul>
<li>you can raise <a href="https://doc.scrapy.org/en/latest/topics/exceptions.html?#closespider" rel="nofollow noreferrer"><code>CloseSpider</code></a> exception in a spider callback, maybe when you catch that exception you mention</li>
<li>you can call <code>crawler.engine.close_spider(spider, 'some reason')</code> if you have a reference to the crawler and spider object, for example in an extension. See <a href="https://github.com/scrapy/scrapy/blob/129421c7e31b89b9b0f9c5f7d8ae59e47df36091/scrapy/extensions/closespider.py#L61" rel="nofollow noreferrer">how the <code>CloseSpider</code> extension is implemented</a> (it's not the same as the <code>CloseSpider</code> exception).
You could hook this with the <a href="https://doc.scrapy.org/en/latest/topics/signals.html#spider-error" rel="nofollow noreferrer"><code>spider_error</code></a> signal for example.</li>
</ul>

I wrote a crawler with Scrapy. 

There is a function in the pipeline where I write my data to a database. I use the logging module to log runtime logs.

I found that when my string have Chinese <code>logging.error()</code> will throw an exception. But the crawler keeps running!

I know this is a minor error but if there is a critical exception I will miss it if crawler keeps running.

My question is: Is there a setting that I can force <code>Scrapy</code> stop when there is an exception?

how to force scrapy exit when there is an exception

翻译质量差，导致语言生硬或混乱。

没有提供实际的解决方法或示例。

解答不清晰，无法理解或解决问题。

页面排版不美观，阅读体验差。

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云AI代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

功能1上新10个字符

功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符功能2描述100个字符。

功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符功能2上新100个字符。

功能5描述100个字符功能5描述100个字符功能5描述100个字符功能5描述100个字符功能5描述100个字符功能5描述100个字符

功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符功能5上新100个字符

功能4上新

文章&问答评论现已支持表情

全新交互，全新视觉，新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能，全面提升创作效率和体验

社区富文本编辑器全新改版！诚邀体验～ 

精选全网热门MCP server，让你的AI更好用 🚀

💥开发者 MCP广场重磅上线！

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

我用Scrapy写了一个爬虫。在管道中有一个函数，我将数据写入数据库。我使用日志模块来记录运行时日志。我发现当我的字符串有中文的时候，logging.error()会抛出一个异常。但爬虫一直在跑！我知道这是一个小错误，但如果有一个关键的例外，我会错过它，如果爬虫继续运行。我的问题是:在出现异常时，是否存在强制Scrapy停止的设置？

问如何在出现异常时强制刮伤退出
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在出现异常时强制刮伤退出EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何在出现异常时强制刮伤退出
EN