我正在使用ICQ协议,我发现特殊字母(fxp变音)有问题。我使用另一种编码(如果我记得的话是CP-1251)读取该ICQ。
如何解码包含文本的字符串以更正编码?
我尝试过使用UTF8Encoding类,但没有成功。
使用ICQ-sharp库。
private void ParseMessage (string uin, byte[] data)
{
ushort capabilities_length = LittleEndianBitConverter.Big.ToUInt16 (data, 2);
ushort msg_tlv_length = LittleEndianBitConverter.Big.ToUInt16 (data, 6 + capabilities_length);
string message = Encoding.UTF8.GetString (data, 12 + capabilities_length, msg_tlv_length - 4);
Debug.WriteLine(message);
}如果联系使用相同的客户端,这是可以的,但如果不是,传入和传出的带有变音符号的消息是不可读的。
我已经确定(使用这个-> https://stackoverflow.com/a/12853721/846232)它是BigEndianUnicode编码的。但如果字符串不包含变音符号,则其不可读(中文字母)。但是,如果我在不带变音符号的文本上使用UTF8编码,这是可以的。但我不知道该怎么做,它会一直被正确地编码。
发布于 2012-10-28 04:09:51
如果UTF-8可以工作(例如,它可以处理"english“或任何US-ASCII字符),那么您就没有UTF-16。Latin1 (或Windows1252,微软的变体),或例如Windows1251或Windows1250是完全可能的,因为它们的第一部分包含没有变音符号的拉丁字母是相同的。
像这样解码:
var encoding = Encoding.GetEncoding("Windows-1250");
string message = encoding.GetString(data, 12 + capabilities_length, msg_tlv_length - 4);https://stackoverflow.com/questions/13079223
复制相似问题