首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >对UTF-16和UTF-32的混淆

对UTF-16和UTF-32的混淆
EN

Stack Overflow用户
提问于 2014-05-29 13:21:17
回答 1查看 213关注 0票数 0

据我所知,UTF-16和UTF-32的主要区别是,UTF-32总是每个字符四个字节,而UTF-16有时是一个字节,有时是每个字符两个字节。这使UTF-16的优点是占用的内存比UTF-32少,但UTF-32具有n个字符恒定时间访问的优点。

我的问题是,如果您可以像在UTF-16中那样用最多两个字节来表示每个unicode字符,那么为什么没有一种总是使用两个字节来编码每个字符的格式呢?这种格式,虽然内存比UTF-16稍贵,但严格来说比UTF-32更好,因为它允许在使用一半内存的同时保持时间访问。

我在这里有什么误会?

EN

回答 1

Stack Overflow用户

发布于 2014-05-29 13:35:56

UTF-16对平面0中的字符使用两个字节,对任何其他字符使用基本多语言平面(BMP)、U+0000...U+FFFF和四个字节。不能以两个字节表示所有Unicode字符。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23934389

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档