我正在尝试找到一个字符串或(不理想的) int表示形式的UCS-2 little endian Encoding.GetEncoding().输入到中
我正在查找这些信息,因为我使用StreamReader读取文件的内容,并且希望使用Encoding.GetEncoding来构造它。
原因是我正在读取几个具有可变编码的不同文件,我需要能够在配置中指定要为哪个文件使用哪种编码。
发布于 2020-02-19 11:40:56
UCS-2可以被认为是UTF-16的一个子集,因此任何UTF-16有能力的解码器也应该能够处理UCS-2;不同的是,UCS-2并不涵盖整个unicode的范围,因此有一些额外的值可以用UTF-16表示,但不能用UCS-2表示。如果文件是由只知道UCS-2的编码器编写的,我们就不应该在这里看到这些值。
这与使用UTF-8解码器读取用纯ASCII编写的数据几乎是一样的(这里所说的“纯”是指7位ASCII,而不是使用8位的扩展代码页)。
因此,以下任何一项:
Encoding direct = Encoding.Unicode;
Encoding byCode = Encoding.GetEncoding(1200);
Encoding byName = Encoding.GetEncoding("Unicode");在这里应该很好。
https://stackoverflow.com/questions/60299218
复制相似问题