我从API中得到了返回b'\\u041a\\u0435\\u0439\\u0442\\u043b\\u0438\\u043d\\u043f\\u0440\\u043e的数据。这些数据是俄文的,我很清楚。我猜这些值是西里尔字母的unicode表示吗?
返回的数据是一个字节数组。
如何将其转换为可读的西里尔字符串?我需要一种方法把这类文字转换成可读的人类文本。
编辑:是的,这是JSON数据。忘了提了抱歉。
发布于 2014-05-27 18:10:06
有可能有JSON数据;JSON使用\uhhhh转义序列来表示Unicode代码点。使用 function对unicode (解码)数据生成一个Python:
import json
string = json.loads(data.decode('utf8'))UTF-8是默认的JSON编码;检查响应头(如果使用的是基于HTTP的API),以查看是否使用了不同的编码。
演示:
>>> import json
>>> json.loads(b'"\\u041a\\u0435\\u0439\\u0442\\u043b\\u0438\\u043d\\u043f\\u0440\\u043e"'.decode('utf8'))
'Кейтлинпро'https://stackoverflow.com/questions/23896124
复制相似问题