我正在尝试让Scrapy输出彩色日志。我对Python日志记录不是很熟悉,但我的理解是我必须制作自己的格式化程序,并让Scrapy使用它。我成功地使用Clint制作了一个格式化程序来对输出进行着色。
我的问题是我不能让它在Scrapy中正常工作。我本以为爬行器中的记录器对象会有一个处理程序,然后我会切换该处理程序的格式化程序。当我查看spider.logger.logger内部的内容时,我发现handler是一个空列表。我尝试在一个新的流处理程序中添加我的格式化程序。
crawler.spider.logger.logger.addHandler(sh),其中sh是使用我的颜色格式化程序的处理程序。
这样做的效果是让scrappy输出每条消息两次。第一条消息是彩色的,但没有Scrapy格式。第二个是没有颜色的Scrapy格式。
如何使Scrapy输出的彩色日志保持可以在settings.py中设置的相同格式
谢谢
发布于 2017-04-10 15:47:53
如果您打算只对LogRecord进行着色,则可以使用ANSI转义码在settings.py中自定义LOG_FORMAT。
示例:
LOG_FORMAT = '\x1b[0;0;34m%(asctime)s\x1b[0;0m \x1b[0;0;36m[%(name)s]\x1b[0;0m \x1b[0;0;31m%(levelname)s\x1b[0;0m: %(message)s'如果您还想用不同的颜色来着色不同的日志级别,您可以覆盖scrapy.utils.log._get_handler(source code)。
把这个放在你的settings.py的顶部
import scrapy.utils.log
_get_handler = copy.copy(scrapy.utils.log._get_handler)
def _get_handler_custom(*args, **kwargs):
handler = _get_handler(*args, **kwargs)
handler.setFormatter(your_custom_formatter)
return handler
scrapy.utils.log._get_handler = _get_handler_custom它所做的是在调用原始_get_handler之后重置格式化程序,然后将其重新附加到scrapy.utils.log。这是一个老生常谈的解决方案,可能不是最佳实践,但它确实有效。
实现这一点的一种更合适的方法是覆盖logging.StreamHandler。这里有a bunch of discussion on,它可以引导你找到正确的方向。
在这里,我提供了在我的项目中使用的完整工作代码(正在使用的是第三方包colorlog )。
settings.py
import copy
from colorlog import ColoredFormatter
import scrapy.utils.log
color_formatter = ColoredFormatter(
(
'%(log_color)s%(levelname)-5s%(reset)s '
'%(yellow)s[%(asctime)s]%(reset)s'
'%(white)s %(name)s %(funcName)s %(bold_purple)s:%(lineno)d%(reset)s '
'%(log_color)s%(message)s%(reset)s'
),
datefmt='%y-%m-%d %H:%M:%S',
log_colors={
'DEBUG': 'blue',
'INFO': 'bold_cyan',
'WARNING': 'red',
'ERROR': 'bg_bold_red',
'CRITICAL': 'red,bg_white',
}
)
_get_handler = copy.copy(scrapy.utils.log._get_handler)
def _get_handler_custom(*args, **kwargs):
handler = _get_handler(*args, **kwargs)
handler.setFormatter(color_formatter)
return handler
scrapy.utils.log._get_handler = _get_handler_customhttps://stackoverflow.com/questions/42095184
复制相似问题