首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在python中转换unicode字符串

在python中转换unicode字符串
EN

Stack Overflow用户
提问于 2012-04-22 10:03:44
回答 3查看 12K关注 0票数 6
代码语言:javascript
复制
{u'Status': u'OK', u'City': u'Ciri\xe8', u'TimezoneName': '', u'ZipPostalCode': '', u'CountryCode': u'IT', u'Dstoffset': u'0', u'Ip': u'x.x.x.x', u'Longitude': u'7.6', u'CountryName': u'Italy', u'RegionCode': u'12', u'Latitude': u'45.2333', u'Isdst': '', u'Gmtoffset': u'0', u'RegionName': u'Piemonte'}

这是我的对象的输出。我想访问City,但它是编码的。如何读取所有参数并将其解码

代码语言:javascript
复制
>>> data['City']
u'Ciri\xe8'

>>>data['City'].decode('utf-8')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe8' in position 4: ordinal not in range(128)

我想要纯文本,而不是unicode字符串。谢谢!

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2012-04-22 11:15:42

请阅读:http://nedbatchelder.com/text/unipain.html

然后把它打印出来:

代码语言:javascript
复制
>>> data = {u'City':u'Ciri\xe8'}
>>> data['City']
u'Ciri\xe8'
>>> print data['City']
Ciriè

如果不打印,Python将打印字符串的安全表示,表明它是Unicode文本u'',并且包含非ASCII码字符\xe8print尝试通过在终端编码中编码Unicode字符串来显示非ASCII码字符。如果字符串包含终端编码不支持的字符,则可能会失败:

代码语言:javascript
复制
>>> print u'\xe8'
è
>>> print u'\x81'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "d:\dev\Python27\lib\encodings\cp437.py", line 12, in encode
    return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\x81' in position 0: character maps to <undefined>

在上面的示例中,code page 437支持Unicode字符U+00E8,但不支持U+0081。

票数 8
EN

Stack Overflow用户

发布于 2012-04-22 10:22:55

你想要什么还不清楚。如果你说的“明文”指的是消除重音,那就试试这个:

代码语言:javascript
复制
>>> s = u'Ciri\xe8'
>>> from unicodedata import normalize
>>> normalize('NFKD', s).encode('ASCII', 'ignore')
'Cirie'
票数 9
EN

Stack Overflow用户

发布于 2012-04-22 10:10:16

明文,我猜你指的是ascii。为此,您可以使用:

代码语言:javascript
复制
data['City'].encode('ascii','ignore')

这将剥离unicode字符并返回

代码语言:javascript
复制
Ciri

有关更多信息,请参阅此链接:http://docs.python.org/howto/unicode.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10264618

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档