我有一个中包含shift-jis编码数据的XML文档,我正在尝试使用NSXMLParser对象来解析它。
通常,我假设文档是UTF8编码的,所有人都知道是否/如何确定一个元素是否是shift-jis编码的,然后如何解码它呢?
谢谢
发布于 2009-08-31 13:56:35
XML文档是UTF-8编码的,除非它有一个XML声明,例如:
<?xml version="1.0" encoding="shift_jis"?>或者:
<?xml version="1.0" encoding="cp932"?>任何XML解析器都应该检测XML声明中给定的编码。(一些解析器可能不支持某些CJK编解码器,因此会抱怨,但AIUI NSXMLParser应该可以。)
如果您有一个没有这样指定编码的Shift-JIS字节序列的文件,或者在某些元素中包含Shift-JIS字节序列,而在另一些元素中包含移位-JIS字节序列,则您所拥有的不是格式良好的文件;它根本不是XML文档,解析器也不会读取它。
如果您刚刚得到了一个缺少的编码声明,那么您确实需要在源端修复它,但同时,在将其输入解析器之前,对适当的XML声明或手动从Shift-JIS到UTF-8的转码 字节数进行黑客攻击应该会有所帮助。
https://stackoverflow.com/questions/1356964
复制相似问题