我从像\u09A8\u09AC\u09AE这样的XML中读取unicode字符。我在XML的标题中使用了<?xml version="1.0" encoding="utf-8"?>。当我使用KXML2解析器从服务器解析xml时,它会将每个unicode字符转换为字符串。如果我将其转换为字符数组,结果如下:
字符0:\
字符1: U
字符2: 0
Char 3: 9
第4章:B
第5章:E
如何取回我的unicode字符?
发布于 2011-08-09 19:08:49
In XML \u09A8 is not a Unicode character reference in XML!
只有几个地方将\u视为Unicode转义的开始,而且它们大多位于Java区域。
在XML语言中,十六进制Unicode转义将是ন,十进制转义将是ন。
换句话说:你得到了字符\,u,0,9,B,E,因为包含了。
最好的解决方案是修复生成此XML的任何内容,使其使用实际的数字实体引用。或者,您可以手动将\u转义替换为相应的字符,但只有您的代码才能正确地解释这个非标准的XML.
https://stackoverflow.com/questions/6995069
复制相似问题