tl;博士如何使用stream.ReadByte()读取可变长度编码的文本?
长版本:
我正在尝试读取一个包含一些文本和二进制数据的文件。这造成了使用像StreamReader这样的方法的问题,因此我正在读取字节并将它们转换为文本。只要文本是ASCII,这就很简单,因为一个字节会转换成一个字符。
但是,当已知文本是用UTF16编码时,字符的长度是可变的。那么,我如何使用stream.ReadByte()并将其转换为UTF16呢?
发布于 2017-05-29 17:29:19
感谢注释的帮助,在对another question of mine的答复中,我现在知道,由于所有的文本都是行,我所需要做的就是读取2个字节并检查它们是否是'\n‘。UTF16是这样的,它将不是“\n”,因为它只是代理项对的一部分。
https://stackoverflow.com/questions/44241329
复制相似问题