我正在打印一些字符串,这些字符串是日本的unicode,为什么print(s1)直接输出日本的unicode,但与s2的输出不一样?如何使s1输出"顧客"?谢谢。
s_before = r'\(9867)\(5BA2)'
s1 = s_before.replace('(','').replace(')','').replace('\\','\\u')
print(s1)
s2 = '\u9867\u5BA2'
print('\u9867\u5BA2')
print(s2)我预计输出如下:
顧客
顧客
顧客但实际产出如下:
\u9867\u5BA2
顧客
顧客发布于 2019-04-09 03:29:54
\u in '\u9867\u5BA2'只是对unicode字符的Python,而不是文字\和u,所以您不能只构建一个文本\和u字符串以及一些代码,并期望它们表示一个unicode字符。
相反,您可以将字符串编码为字节,然后用unicode_escape编码对其进行解码,使其成为实际的unicode字符串:
s_before = r'\(9867)\(5BA2)'
s1 = s_before.replace('(','').replace(')','').replace('\\','\\u').encode().decode('unicode_escape')
print(s1)这一产出如下:
顧客https://stackoverflow.com/questions/55584596
复制相似问题