首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >.NET中的智能UTF-8到UTF-7

.NET中的智能UTF-8到UTF-7
EN

Stack Overflow用户
提问于 2009-07-30 20:52:02
回答 1查看 4.7K关注 0票数 3

如果我有一个字符串的UTF-8字符,他们需要输出到一个较旧的系统,如UTF-7,我有两个问题与此有关。

如果没有efficiently?

  • Are字符,如何将具有UTF-8字符的字符串转换为相同的字符串?有任何简单的方法可以将像'Ō‘这样的扩展字符转换为它们最近的非扩展等价的'O'?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2009-07-30 20:58:35

如果旧的系统能够正确地处理UTF-7,为什么要删除任何东西?只需将字符串编码为UTF-7:

代码语言:javascript
复制
string text = LoadFromWherever(Encoding.UTF8);
byte[] utf7 = Encoding.UTF7.GetBytes(text);

然后将UTF-7编码的文本发送到旧系统。

如果您已经获得了原始的UTF-8编码字节,您可以在一个步骤中这样做:

代码语言:javascript
复制
byte[] utf7 = Encoding.Convert(Encoding.UTF8, Encoding.UTF7, utf8);

如果您实际上需要转换为ASCII,您可以相当容易地做到这一点。

要删除非ASCII字符,请执行以下操作:

代码语言:javascript
复制
var encoding = Encoding.GetEncoding
    ("us-ascii", new EncoderReplacementFallback(""), 
     new DecoderReplacementFallback(""));
byte[] ascii = encoding.GetBytes(text);

将非ASCII转换为最接近的等价物:

代码语言:javascript
复制
string normalized = text.Normalize(NormalizationForm.FormKD);
var encoding = Encoding.GetEncoding
    ("us-ascii", new EncoderReplacementFallback(""), 
     new DecoderReplacementFallback(""));
byte[] ascii = encoding.GetBytes(normalized);
票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/1209309

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档