UTF-32和UCS-4有什么区别?UTF-32不应该是一个固定宽度的编码吗?
发布于 2015-05-12 09:27:45
UTF-32从UCS-4的一个子集开始。现在它是相同的,除了UTF-32标准有额外的Unicode语义。参见关于维基百科的详细信息
最初的 10646标准定义了一种称为UCS-4的31位编码形式,其中通用字符集(UCS)中的每个编码字符都由0和十六进制7 7FFFFFFF之间整数的代码空间中的32位友好代码值表示。 因为实际上只有17架飞机在使用,所以当前的所有代码点都在和0x10FFFF之间。UTF-32是仅使用此范围的UCS-4的子集.由于JTC1 1/SC2/WG2的原则和程序文件规定,今后所有字符的分配将被限制在BMP或前14个辅助平面上,因此UTF-32将能够表示所有Unicode字符。因此,UCS-4和UTF-32现在是相同的,只是UTF-32标准有额外的语义。
然而,我不太清楚,additional Unicode semantics是什么意思。也许有人能给出一个更好的答案。
发布于 2016-06-09 08:02:02
Unicode标准版本8.0,附录C指出:
UCS-4代表“通用字符集,以4位字节编码。”它现在被简单地看作是UTF-32的同义词,并且被认为是在ISO 10646 (通用编码字符集)中表示字符的规范形式。
https://stackoverflow.com/questions/30186631
复制相似问题