Windows使用uniscribe库来替换基于位置的阿拉伯语和印地语键入的字符。新的字形仍然具有键入字符的原始unicode,尽管它有其专用的Unicode表示,如何获得实际显示的Unicode而不是键入的Unicode。
发布于 2011-05-25 18:34:32
有很多这样的工具,比如ICU,Charmap和其他工具。我自己推荐http://unicode.codeplex.com,它使用Unicode字符数据库来表示字符。
请注意,unicode只是一些关于字符的信息,并没有谈到表示。他们只是建议像他们的例子一样实现一个单词。因此,要查看每个代码,你需要像MS Arial Unicode这样的Standard Unicode Font,它是windows平台上最大和最好的选择。
大多数字符都是在这种字体中实现的,但对于新字符,您需要对其进行更新(如果有这样的更新),或者您可以使用您知道它实现了所需字符的字体
发布于 2011-05-28 17:52:56
您对Uniscribe中发生的事情的解释是不正确的。一旦您有了字形,原始信息就消失了,没有可靠的方法可以返回到Unicode。
即使不去阿拉伯语,也无法区分连字的字形(例如)是来自“f”和“i”(U+0066 U+0069),还是来自“fi”(U+FB01)。(http://www.fileformat.info/info/unicode/char/fb01/index.htm)
此外,一些生成的字形没有与之关联的Unicode值,因此没有“实际显示内容的Unicode”
https://stackoverflow.com/questions/6100796
复制相似问题