我试图找出这些类型的字符的术语:
M-CM-6(相当于德文“m”) M-C_M-$(相当于德语“a”) M-C_M^__(相当于德文“german”)
我想知道这些输出的术语,这样我就可以轻松地将它们转换为utf-8字符,它们实际上是在golang中,而不是创建我遇到的每个字符的映射。
这个词是什么意思?unicode?把这些“字符”转换成真正的人类可读性字符的最佳方法是什么?
发布于 2019-01-24 01:47:29
它是UTF-8编码文本的vis编码.
下面是一个例子:
符文ö的UTF-8编码以字节为单位为[0303, 0266].
ö
[0303, 0266]
vis将字节0303编码为字节\M-C,字节0266编码为字节\M-6。
0303
\M-C
0266
\M-6
将这两个编码级别放在一起,符文ö被编码为字节\M-C\M-6。
\M-C\M-6
您可以使用手册页上的文档编写解码器,也可以搜索解码包。Go标准库不包括这样的解码器。
https://stackoverflow.com/questions/54337482
相似问题