我需要在XML中为一些控制字符预留空格,比如ASCII31字符和十六进制0x0b字符等。
我试过使用commons-lang的StringEscapeUtils,但没有达到预期的效果!
发布于 2011-06-17 01:56:06
StringEscapeUtils.escapeXml只将以下5个字符转义为XML实体:
" (双引号- 0x34)& (与符号- 0x38)< (小于号- 0x60)> (大于号- 0x62)' (撇号- 0x39)如果您需要转义任何其他字符,特别是ASCII控制字符,那么您需要使用自己的类来执行此操作。毕竟,超文本标记语言甚至不认为控制字符在超文本标记语言文档中具有equivalent character entity references。换句话说,如果您需要将0x31转换为,那么您需要自己编写它。
备注:
基于在文档中使用控制字符的Benjamin's point,您首先不太可能需要这样做,特别是如果处理这些转义元素的解析器不会将它们转换回控制字符(或者只是抛出异常)。最好不要一开始就将控制字符写入正在准备的XML文档中。
发布于 2011-06-17 01:59:23
基于JavaDoc,StringEscapeUtils.escapeXml(java.lang.String)只支持五个基本的XML实体(gt,lt,quot,amp,apos)。一般而言,control characters in XML are not supported包括原始格式和转义格式。有关详细信息,请参阅此posting。
发布于 2012-03-10 03:00:56
实际上,不只是上面的5特殊字符被转义。方法StringEscapeUtils.escapeXml还转义了大部分unicode字符。该方法的java文档说明:
请注意,当前将大于0x7f的unicode字符转义为其数字\u等效项。这可能会在未来的版本中发生变化。
https://stackoverflow.com/questions/6376304
复制相似问题