我的应用程序中有一个WinForms RichTextBox。当我输入中文文本"蜜蜜蜜蜜“时,控件使用以下RTF:
{\rtf1\ansi\ansicpg1252\deff0\deflang1033{\fonttbl{\f0\fmodern\fprq6\fcharset134 Serif;}{\f1\fnil\fCharset0 Microsoft Sans SimSun;}} \viewkind4\uc1\pard\f0\fs17\'c3\'db\'c3\'db\'c3\'db\'c3\'db\f1\par }
测试字符串有四次相同的字符。它的Unicode值是34588 (0x871C)。那么,字符是如何在RTF中存储为"\'c3\'db“的呢?这是一种什么样的编码?
发布于 2010-02-11 04:24:51
RTF很老,比Job还老,而且比Unicode早很多。我认为它使用的是code page 936,一种用于简体中文的双字节字符集。您的代码片段使用字符的c3db显示它,它与this table中显示的字形相匹配。
https://stackoverflow.com/questions/2239791
复制相似问题