首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >“源代码字符集”Vs“执行字符集”

“源代码字符集”Vs“执行字符集”
EN

Stack Overflow用户
提问于 2015-08-05 08:18:45
回答 1查看 76关注 0票数 1

在javascript世界里,

我了解到Javascript源代码字符集通常是UTF-8(但并非总是如此)。 我听说Javascript (执行)字符集是UTF-16

我该如何解释这两个术语?

注意:答案可以通过使用另一种语言,比如java,得到与语言无关的答案。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-08-08 00:04:08

很好,大多数源代码都是用utf-8编写的,或者应该是。由于源代码大部分是英文的,使用ASCII兼容的字符,而utf-8在这个字符范围内效率最高,有很大的优势。无论如何,它已经成为事实上的标准。

JavaScript是在世界其他地方开发utf-8之前开发的,因此它遵循了在所有字符串中使用utf-16的实践,这在当时是相当有前瞻性的。这意味着所有字符串,无论是在源中编码的,还是以其他方式获得的,都将以utf-16编码。

在大多数情况下,这并不重要。源代码是为人类和执行字符集是为机器。然而,这一事实确实存在两个小问题:

  • 如果您的字符串很大程度上是ASCII范围,那么JavaScript字符串可能会浪费很多空间(在英语中,甚至在使用空格的其他语言中也是如此)。
  • 与utf-8一样,utf-16也是可变宽度的,尽管大多数语言中的大多数字符都适合于正常的2字节;但是,如果一些字符扩展到4个字节,JavaScript可能会错误地计算字符串的长度。

除了哪种编码更适合特定人类语言的问题之外,没有哪种编码比另一种更有优势。如果JavaScript是最近开发出来的,它可能会对字符串使用utf-8编码。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/31827037

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档