我有一个文本,需要将其存储在widestring变量中。但我的文本是UTF8,宽字符串不支持UTF8,并将其转换为一些中文字符。
那么有没有UTF8版本的WIDESTRING呢?
我总是使用UTF8string,但在这种情况下,我必须使用WideString
发布于 2013-07-11 05:17:16
当您将UTF8String变量赋给WideString变量时,编译器会自动插入解码字符串的指令(在Delphi2009和更高版本中)。它将UTF-8转换为UTF-16,这也是WideString所持有的。如果WideString变量包含中文字符,那是因为UTF8编码的字符串包含UTF8编码的中文字符。
如果您希望字符串ws在UTF8String s中包含16位版本的字节,那么您可以通过一些类型转换绕过自动转换:
var
ws: WideString;
i: Integer;
c: AnsiChar;
SetLength(ws, Length(s));
for i := 1 to Length(s) do begin
c := s[i];
ws[i] := WideChar(Ord(c));
end;如果您使用的是Delphi2009或更高版本(包括XE系列),那么您应该考虑使用UnicodeString而不是WideString。前者是原生Delphi类型,而后者更像是Windows BSTR类型的包装器。但是,在对UTF8String等AnsiString派生函数进行赋值时,这两种类型都会表现出自动转换行为,因此您使用的类型不会影响此答案。
在早期的Delphi版本中,编译器会尝试使用系统代码页(从来不是UTF-8)来解码字符串。要使其正确解码字符串,请调用Utf8Decode
ws := Utf8Decode(s);https://stackoverflow.com/questions/17580870
复制相似问题