搜索 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

来自专栏码云1024
字符编码
比如，"中文123" 在中文 Windows 95 内存中为7个字节，每个汉字占2个字节，每个英文和数字字符占1个字节。用来给 UNICODE 字符集编码的标准有很多种，比如：UTF-8, UTF-7, UTF-16, UnicodeLittle, UnicodeBig 等。 5.2 UTF-7、UTF-8和UTF-16 在Unicode里，所有的字符被一视同仁。 5.2.3 UTF-7 UTF-7 (7-位元 Unicode 转换格式（Unicode Transformation Format，简写成 UTF）) 是一种可变长度字元编码方式，用以将 Unicode UTF-7并非Unicode标准之一。想要详细了解的可以查阅相关资料。
2.8K40发布于 2018-09-28
来自专栏明明如月的技术专栏
字符编码
字符编码知识：Unicode、UTF-8、ASCII、GB2312等编码之间是如何转换的？字符编码是计算机技术的基石，想要熟练使用计算机，就必须懂得字符编码的知识。上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为ASCII码，一直沿用至今。这128个符号（包括32个不能打印出来的控制符号），只占用了一个字节的后面7位，最前面的1位统一规定为0。 UTF-8的编码规则很简单，只有二条： 1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。 4）UTF-8编码，也就是上一节谈到的编码方法。选择完”编码方式“后，点击”保存“按钮，文件的编码方式就立刻转换好了。 7.
2K20发布于 2021-08-27
来自专栏python3
字符编码
字符编码计算机基础 ? 文本编辑器存取文件的原理 1.打开编辑器就打开启动了一个进程，是在内存中，所以，用编码器编写的内容也都存放在内存中的，断电后数据丢失。 3.早我们编写一个py文件，跟便携其它文件一样，都是一堆字符 python解释器执行py文件的原理第一阶段：Python解释器启动，此时就相当于启动了一个文本编辑器第二阶段：Python解释器相当于文本编辑器第三阶段：Python解释器解释执行刚刚加载到内存中test.py的代码( ps：在该阶段，即真正执行代码时，才会识别Python的语法，执行文件内代码，当执行到name="egon"时,会开辟内存空间存放字符串字符编码字符编码是将人类的字符编码成计算机能识别的数字，这种转换必须遵循一套固定的标准，该标准无非是人类字符与数字的对应关系，称之为字符编码表。字符编码发生在哪三个阶段 1存内存到硬盘 2取硬盘到内存 3python3解释器解释乱码分析存的时候用什么编码，取的时候用什么编码
1.6K10发布于 2020-01-15
来自专栏_春华秋实
字符，字符集，字符编码
字符，字符集，字符编码　　简书郭文圣现在Unicode已然一统天下，我想很多年轻的程序员可能都没遇到过编码问题，更不用说了解编码的发展了。字符集是字符组成的集合，通常以二维表的形式存在，二维表的内容和大小是由使用者的语言而定，是英语，是汉语，还是阿拉伯语。字符编码是把字符集中的字符编码为特定的二进制数，以便在计算机中存储。字符集和字符编码一般都是成对出现的，如ASCII、IOS-8859-1、GB2312、GBK，都是即表示了字符集又表示了对应的字符编码，以后统称为编码。 128个码位，用7位二进制数表示，由于计算机1个字节是8位二进制数，所以最高位为0，即00000000-01111111或0x00-0x7F。 ? 对同一组二进制数据，不同的编码会解析出不同的字符，用对了编码，解析出来的字符组成的文字是有意义的，用错了编码，解析出来的字符组成的文字是没意义的，也就是通常所说的乱码。
2.1K30发布于 2019-02-22
来自专栏PHP在线
字符编码笔记
字符编码笔记：ASCII，Unicode和 UTF-8 1. ASCII码我们知道，在计算机内部，所有的信息最终都表示为一个二进制的字符串。上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为ASCII码，一直沿用至今。这128个符号（包括32个不能打印出来的控制符号），只占用了一个字节的后面7位，最前面的1位统一规定为0。 UTF-8的编码规则很简单，只有二条： 1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的unicode码。因此对于英语字母，UTF-8编码和ASCII码是相同的。选择完”编码方式“后，点击”保存“按钮，文件的编码方式就立刻转换好了。 7. Little endian和Big endian 上一节已经提到，Unicode码可以采用UCS-2格式直接存储。
1.7K90发布于 2018-03-07
来自专栏01ZOO
字符编码实战
至于数字和二进制的对应关系，这点和补码这种设计有关，简单来说就是正数的补码：与原码相同，比如 7 的补码表示是 00000111, 而负数的补码则是所有位取反并加一，比如 -7 的补码是 11111001 AscII 码虽然使用一个字节表示，但是实际只占用了其中的 7 个bit，表示了共计 128 个字符，第一个 bit 统一为 0。其中 32 个为控制字符【即不可打印，用作控制】，剩下的为可见字符。 UTF-8 最大的一个特点，就是它是一种变长的编码方式。他是一种针对Unicode的可变长度字符编码，也是一种前缀码。它可以用一至四个字节对Unicode字符集中的所有有效编码点进行编码，属于Unicode标准的一部。根本原因是 python2 的字符串是 ASCII 编码的，也就是说 python 中的一个 string，它只能表示一个 ASCII 编码的字符串，如果要表示 unicode 字符串怎么办呢，python2
2.3K70发布于 2021-03-07
关于字符编码
##关于字符编码内容涉及：UTF-8编码UTF-16编码你好UTF8编码：E4 BD A0 E5 A5 BD计算UTF-16编码得到：UTF16编码: 4F 60https://home.unicode.org /Unicode，统一码、万国码、单一码，是计算机科学领域里的一项业界标准，包括字符集、编码方案等。 Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。早期的Unicode字符集(Unicode Character Set)使用2字节编码，即UCS-2。与UTF-16类似，UTF-32也包括UTF-32、UTF-32LE、UTF-32BE三种编码，UTF-32使用的BOM就是FFFE0000(UTF-32LE)和0000FEFF(UTF-32BE)实际计算机中存储的字符
59110编辑于 2024-06-25
来自专栏Crossin的编程教室
判断字符编码
今天本来打算讲点新课的，后来有些事耽搁，也没时间准备了，就分享一个小工具吧： python里面的字符编码是让人头大的一个东西，甚至很多时候你都不知道现在拿到的文本到底是什么编码。这时候，chardet可以帮你判断编码。chardet是python的第三方扩展，用来检测字符串或文件的编码。使用中，你有一个待检测的字符串s，只需： import chardet print chardet.detect(s) 就可以看到输出结果： {'confidence': 0.98999999999999999 , 'encoding': 'GB2312'} confidence是预测这种编码的可能性，encoding是编码名称。
2.2K50发布于 2018-04-16
来自专栏python3
python字符编码
近期接触到python的编码相关的东西，发现自己了解的不是太系统，故通过搜索资料做了一些总结。字符编码字符串也是一种数据类型，但是，字符串比较特殊的是还有一个编码问题。上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系，做了统一规定。这被称为 ASCII 码，一直沿用至今。字母A: 用ASCII编码是十进制的65，二进制的01000001；字符0: 用ASCII编码是十进制的48，二进制的00110000，注意字符'0'和整数0是不同的；汉字中: 已经超出了ASCII UTF-8 的编码规则很简单，只有二条： 1）对于单字节的符号，字节的第一位设为0，后面7位为这个符号的 Unicode 码。因此对于英语字母，UTF-8 编码和 ASCII 码是相同的。 () Out[16]: 'utf-8' In [17]: '离离原上草，一岁一枯荣'.encode('utf-8') Out[17]: b'\xe7\xa6\xbb\xe7\xa6\xbb\xe5\x8e
2.1K20发布于 2020-01-13
来自专栏雨临Lewis的博客
Java - 字符编码
因为Unicode使用四个字节来存储，虽然编码效率高，但是会极大浪费存储空间，因此就有了对Unicode字符集进行编码解码的存储方式，如UTF-8等字符编码。字符编码其实就是对Unicode字符集的实现方式，用以约定如何用1~4个字节来存储字符。字符编码 UTF-8 UTF-8是可变长编码，即多字节编码，在存储不同的字符时使用的字节数量是不同的。 Java就是使用的这个编码来存储字符，中文和英文都是两个字节（即char这个基础数据类型），所以Java是双字节编码。 UTF-16LE，使用两个字节进行存储的小端编码。不同字符集编码的英文字母和中文汉字的字节数英文字母： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 编码：GB2312；字节数 : 1 编码：GBK；字节数 : 2 编码：UTF-16LE；字节数 : 2 中文汉字： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 编码：GB2312；字节数 : 2 编码：GBK
2.4K10编辑于 2022-02-14
来自专栏python3
字符编码简介
GBK向下与GB2312编码兼容，其编码范围从8140至FEFE（剔除xx7F），共23940个码位，共收录了21003个汉字。 Unicode把所有语言都统一到一套编码里，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。因为Python的诞生比Unicode标准发布的时间还要早，所以最早的Python只支持ASCII编码，普通的字符串'ABC'在Python内部都是ASCII编码的。现在Python支持Unicode编码了 UTF-8 　　UTF-8是一种针对Unicode的可变长度字符编码，又称万国码，由Ken Thompson于1992年创建。 UTF-8用1到6个字节编码Unicode字符。ASCII字符在utf-8编码格式中占用一个字节，汉子则占用三个字节。
1.6K20发布于 2020-01-19
来自专栏wOw的Android小站
聊聊字符编码
in position 63897: invalid continuation byte Log的意思是,UTF-8的解码器无法处理字符0xe7 最后的解决方案是使用latin-1编码: html = ASCII编码学编程的时候,ASCII是最早介绍的字符编码. 标准ASCII使用7位二进制数,因为一个字节占8位,所以在第一位补0形成8位. 对照ASCII码,7位一共128个字符,231明显超过了128,所以对于ASCII编码来说,它并不认识0xe7. 这也说明了一个问题,由于ASCII编码长度很短,可以表示的字符有限,遇到中文或者其他字符,就需要其他编码来表示. 主要聊聊常见的UTF-8 UTF-8规则: 如果字符只有一个字节则其最高二进制位为0,后7位是字符的Unicode码.单字节的编码和ASCII一致对于N字节(N>1),第一个字节前N位设为1,第N+1
1.5K20发布于 2018-09-18
来自专栏这里只有VxWorks
关于字符编码
所以需要某种多字节编码方案 GB 2312-80 是1980年制定的中国汉字编码国家标准。共收录 7445 个字符。将区号和位号分别加上0x20，称为国标码，编码范围就是0x2121～0x7E7E。为了兼容ASCII码，再给国标码的每个字节加0x80，形成机内码，简称内码，是汉字在机器中实际的存储代码。信息技术中文编码字符集》，是中华人民共和国现时最新的内码字集。，包括字符集、编码方案等。 Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求。
1.3K20发布于 2021-12-02
来自专栏老齐教室
字符编码简介
于是有了针对其他语言的编码，例如ISO 8859（全称ISO/IEC 8859，是国际标准化组织（ISO）及国际电工委员会（IEC）联合制定的一系列8位字符集的标准）针对希腊语提出了ISO 8859-7 编码字符集。 Unicode 包括视觉上的字形、编码方法、标准的字符编码、字符特性（大小写字母）。例如字符 A ，按照 ASCII 只要编码为 1000001 （7位）即可，若使用 Unicode 编码需要用两个字节，第一个字节全是 0 ，这显然造成了比较大的浪费，所以需要“变长编码”，即 ASCII 字符用一个字节（仍用7位编码，首位补 0），其他字符用两个、三个，乃至四个字节。
2.4K50发布于 2021-05-20
来自专栏程序生涯
字符集和字符编码
ASCII 码使用 7 位二进制数来表示 128 个字符，也就是用一个字节来表示，最前的一位默认为 0。 ASCII 码诞生，保留原始的7位的基础上，使用了最前的一位。题外话：一个小于127的字符的意义与原来相同，但两个大于127的字符连在一起时，就表示一个汉字，前面的一个字节（他称之为高字节）从0xA1用到 0xF7，后面一个字节（低字节）从0xA1到0xFE，这样我们就可以组合出大约例如ASCII字符编码规定使用单字节中低位的7个比特去编码所有的字符。例如‘A’的编号是65，用单字节表示就是0x41，因此写入存储设备的时候就是b’01000001’。 7、总结字符集定义了一组字符，编码定义了如何来表示字符集中的字符（是不是有点类似抽象类与实现类的关系呢？）。
1.5K40发布于 2020-08-14
来自专栏编程之路的专栏
字符编码的前世今生——一文读懂字符编码
编码从故事说起关于计算机的字符编码，很多人都是一知半解的，笔者遇到过做了几年开发的程序员，还是说不清字符编码是什么，乱码又是怎么回事，实际上笔者早期也说不清个所以然，后来有一次做一个自己的app，期初用 l，那么现在要先计算，12*2+7就是31，对方收到后再做一次逆运算，那就是(31-7)/2 从这之后，小明小红的纸条再没被人破解过，与此同时，六年级二班兴起一股玩传纸条游戏的风，到后来，不仅仅是对字母编号计算机的字符编码现在回到计算机世界的字符编码问题，要弄清楚计算机字符编码问题，咱们还得继续讲故事。一个字节就是8位二进制，最高位是符号位，所以7位有效，那最大也就是2的7次方，正好就是128。但是欧洲人想，咱们欧洲字母那么少，不可能用两个字节去存吧，太浪费了，于是开动脑筋，使用无符号8位二进制，一个字节8位，通常只有7位是有效位，但是字符编码，不可能有负数啊，只需要正数就行了，于是将8位都变成有效位
2.9K40发布于 2019-06-26
来自专栏用户4352451的专栏
字符，字符串，字符编码的区别
字符，字符串，字符编码概念字符是一个信息单位，在计算机里面，一个中文汉字是一个字符，一个英文字母是一个字符，一个阿拉伯数字是一个字符，一个标点符号也是一个字符。字符集是字符组成的集合，通常以二维表的形式存在，二维表的内容和大小是由使用者的语言而定，是英语，是汉语，还是阿拉伯语。字符编码是把字符集中的字符编码为特定的二进制数，以便在计算机中存储。字符集和字符编码一般都是成对出现的，如ASCII、IOS-8859-1、GB2312、GBK，都是即表示了字符集又表示了对应的字符编码，以后统称为编码。一个字符有多少个字节 GBK编码，一个汉字占两个字节。 5.0版本之前是20个字节参考资料 https://www.jianshu.com/p/bd7a6c508c33 https://zh.wikipedia.org/wiki/UTF-8 https
1.7K20发布于 2020-08-26
来自专栏业余草
java字符编码转换
在开发的过程中，字符编码常常令我们头痛。经常会出现各种各样的乱码。下面就介绍java的编码转换和常见的乱码是使用什么样的编码去读取的：先看一张图片： ? 在看看java中如何处理编码的转换： package com.test; /** * 字符串编码转换 * @author Herman.xiong * @date 2015年7月16日09:36
4K30发布于 2019-01-21
来自专栏全栈程序员必看
python 之字符编码
：文本编辑器将文件内容读入内存后，是为了显示/编辑，而python解释器将文件内容读入内存后，是为了执行（识别python语法）二什么是字符编码字符编码的定义: 所谓的字符编码就是让计算机读懂人类语言的字符字符编码产生的过程字符--------（翻译过程）------->数字这个过程实际就是一个字符如何对应一个特定数字的标准，这个标准称之为字符编码字符编码的涉及场景　1. UTF-8：延续了万国编码的传统，但是解决了万国编码占用内存大的问题 GBK：只限于中国内部使用的字符编码各类型字符编码之间的关系 ASCII码是字符编码的鼻祖最早诞生与西方世界，因为只局限与西方世界使用所以诞生了 decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312')，表示将gb2312编码的字符串str1转换成unicode编码。 encode的作用是将unicode编码转换成其他编码的字符串，如str2.encode('gb2312')，表示将unicode编码的字符串str2转换成gb2312编码。
1.2K20编辑于 2022-07-21
来自专栏sktj
oracle 转换字符编码
查看编码 select userenv('language') from dual; shutdown immediate startup mount alter system enable restricted
2.1K20编辑于 2022-05-20

第 2 页第 3 页第 4 页第 5 页第 6 页第 7 页第 8 页第 9 页第 10 页第 11 页

点击加载更多

字符编码

字符编码

字符编码

字符，字符集，字符编码

字符编码笔记

字符编码实战

关于字符编码

判断字符编码

python字符编码

Java - 字符编码

字符编码简介

聊聊字符编码

关于字符编码

字符编码简介

字符集和字符编码

字符编码的前世今生——一文读懂字符编码

字符，字符串，字符编码的区别

java字符编码转换

python 之字符编码

oracle 转换字符编码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐