punycode.ucs2.decode(string) 创建一个包含字符串中每个Unicode符号的数字编码点的数组。
对于UTF-16,UTF-32,UCS2和UCS4,编码检测将始终失败。 返回值 设置编码检测顺序时,TRUE会在成功或FALSE失败时返回。 获取编码检测顺序时,将返回一个有序的编码数组。
wchar_t...在一个16位的系统上wchar_t,第三个字符的解码将失败,因为std::codecvt_utf16<char16_t>生产UCS2,而不是UTF-16。
在UTF-16/UCS2中,'?'被表示为一个代理对,这意味着它是利用一对的值的16位的代码单元,具体地编码0xD842和0xDFB7。以前这意味着你必须按照代码转义"\uD842\uDFB7"。
不是基于ASCII的编码(例如UCS-2)是不允许的,应该用包装codecs.getreader(encoding)(fp)或简单解码到一个unicode对象并传递给它loads()。
如果给出了一个unicode参数并且Python是使用UCS2Unicode编译的,那么该字符的代码点必须在0到65535之间否则字符串长度是两个,并且aTypeError会被提出。
ucs2'-'utf16le'的子集。'base64'-Base64字符编码。'binary'-仅使用每个字符的头8位将原始的二进制信息进行编码。
UCS-4基本上与UTF-32相同,但是没有由IEEE定义的一些Unicode语义,并且几乎没有用作单独的编码标准。对于所有正常(可能异常)的使用,UTF-32和UCS-4是可以互换的。
在这种情况下,“Unicode编码”是指任何UTF-8,UTF-16BE/LE和UTF-32BE/LE,以及GB18030,UCS_2BE和UCS_4BE。

扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2026 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059
粤公网安备44030502008569号
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号
