我使用mongodb和redis,redis是我的缓存。
我使用redis-py缓存mongodb对象:
obj in mongodb: {u'name': u'match', u'section_title': u'\u6d3b\u52a8', u'title':
u'\u6bd4\u8d5b', u'section_id': 1, u'_id': ObjectId('4fb1ed859b10ed2041000001'), u'id': 1}使用hgetall(key,obj)从redis获取的obj为:
{'name': 'match', 'title': '\xe6\xaf\x94\xe8\xb5\x9b', 'section_title':
'\xe6\xb4\xbb\xe5\x8a\xa8', 'section_id': '1', '_id': '4fb1ed859b10ed2041000001', 'id': '1'}如你所见,从缓存中获取的obj是str而不是unicode,所以在我的应用程序中会出现这样的错误:'ascii‘编解码器无法解码位置12中的字节0xe6 :序数不在范围内(128)
有没有人能给点建议?谢谢你
发布于 2012-05-15 21:27:54
更新,对于全局设置,请检查jmoz's answer。
如果您正在使用第三方库,比如django-redis,您可能需要指定一个定制的ConnectionFactory
class DecodeConnectionFactory(redis_cache.pool.ConnectionFactory):
def get_connection(self, params):
params['decode_responses'] = True
return super(DecodeConnectionFactory, self).get_connection(self, params)假设你正在使用redis-py,你最好将str而不是unicode传递给Redis,或者对于*set命令传递Redis will encode it automatically,通常是in UTF-8。对于*get命令,Redis不知道值的形式类型,只能直接在str中返回值。
因此,正如Denis所说,将对象存储到Redis的方式至关重要。您需要将该值转换为str,以使Redis层对您透明。
此外,不使用ascii,而使用set the default encoding to UTF-8
发布于 2012-09-06 00:18:38
我想我发现了问题所在。读完这篇文章后,我不得不显式地从redis中解码,这很痛苦,但很有效。
我偶然发现了一篇博文,其中作者的输出都是unicode字符串,这与我的不同。
查看StrictRedis.__init__,有一个参数decode_responses,缺省情况下它是False。https://github.com/andymccurdy/redis-py/blob/273a47e299a499ed0053b8b90966dc2124504983/redis/client.py#L446
在construct上传入decode_responses=True,对我来说,这解决了OP的问题。
发布于 2012-05-15 18:54:00
对于每个字符串,您可以使用decode函数将其转换为utf-8格式,例如,对于代码中的标题字段的值:
In [7]: a='\xe6\xaf\x94\xe8\xb5\x9b'
In [8]: a.decode('utf8')
Out[8]: u'\u6bd4\u8d5b'https://stackoverflow.com/questions/10599147
复制相似问题