首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >虚拟人的Unicode指南

虚拟人的Unicode指南
EN

Stack Overflow用户
提问于 2009-09-21 14:58:28
回答 7查看 4.3K关注 0票数 11

谁能给我一个简明的定义

  • Unicode
  • UTF7
  • UTF8
  • UTF16
  • UTF32
  • 代码页
  • 它们与Ansi/Ansi/Windows 1252有何不同?

我不是在关注维基百科的链接或令人难以置信的细节,我只是简单地介绍了Unicode中巨大的变化是如何产生的,以及为什么您应该关心作为一个程序员。

EN

回答 7

Stack Overflow用户

回答已采纳

发布于 2009-09-21 15:00:16

这是一个很好的开始:每个软件开发人员绝对、积极的绝对最低限度必须了解Unicode和字符集(没有借口!)

票数 19
EN

Stack Overflow用户

发布于 2009-09-22 17:16:22

如果你想简单介绍一下:Unicode在5分钟内

或者如果你想要的是一条线:

  • Unicode:将字符映射到0到1,114,111范围内的整数(“代码点”);涵盖几乎所有使用中的书面语言
  • UTF7:将代码点编码成字节流的高比特清晰的;一般不使用
  • UTF8:将代码点编码成字节流,每个字符可以用一个、两个、三个或四个字节来表示;应该是编码的主要选择。
  • UTF16:将代码点编码成一个字流(16位单位),其中每个字符可以用一个或两个单词(两个或四个字节)来表示。
  • UTF32:将代码点编码成由32位单元组成的流,其中每个字符只需要一个单位(4个字节);有时用于内部表示。
  • 代码页::DOS和中的一个系统,它将字符分配给整数,并进行相关的编码;每个系统只包含一个语言子集。请注意,这些赋值通常与Unicode分配不同。
  • ASCII:是一种非常常见的字符赋值给整数,直接编码为字节(都很清晰);赋值是Unicode的子集,编码是UTF-8的子集。
  • ANSI:标准机构
  • Windows 1252:是常用的代码页;它类似于ISO-8859-1或拉丁文-1,但不是相同的,这两者常常是混淆的。

你为什么这么在意?因为如果不知道字符集和正在使用的编码,您就无法真正知道给定字节流代表什么字符。例如,字节0xDE可以编码。

  • (拉丁文大写字母刺)
  • 拉丁小结扎FI(fi)
  • ή(带托诺斯的希腊文小写字母ETA )
  • 或其他13个字符,取决于所使用的编码和字符集。
票数 13
EN

Stack Overflow用户

发布于 2009-09-21 15:09:38

除了oft引用的Joel之外,我还有我自己的文章,它从以.NET为中心的角度来看待它,只是为了多样化……

票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1454952

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档