我知道unicode是一个巨大的符号集。它使日本有中国字母表。
我正在阅读有关UTF-8/16/32的信息,但我找不到这样的短语,即我可以使用UTF-8/16/32对unicode中的任何符号进行绝对编码。
每个unicode编码都有相同的能力,这是真的吗?
如果是真的,那么使用utf-16/32的原因是什么,如果在共同的- utf-8中使用内存更“体面”和ascii兼容性?
发布于 2014-07-07 08:40:22
是的你可以。对于所有读者: Unicode是从U+0000到3字节范围的编号。UTF-8是一种多字节码,它将字节链到设置为高比特、某些序列位和自由编号位的情况下。也有一个逃逸。而UTF-32就足够了。
对于亚洲剧本来说,UTF-8不是最优的,而拉丁文是最优的.一般情况下,这只会在小型设备或大型数据库上发挥作用。
发布于 2014-07-07 08:37:59
所有的UTF-x编码都可以表示所有Unicode码点序列.
对于乌特夫-32,每个代码点需要4个字节。
对于乌特夫-16,大多数代码点使用2字节;外来代码点通过UTF-16代理使用4字节。
使用UTF-8,一个代码点可以使用1到4个字节。
使用欧洲字符集,UTF-8是内存效率最高的编码.
https://stackoverflow.com/questions/24606128
复制相似问题