首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Apache commons-lang StringEscapeUtils不能转义XML

Apache commons-lang StringEscapeUtils不能转义XML
EN

Stack Overflow用户
提问于 2011-06-17 01:47:55
回答 3查看 5.8K关注 0票数 1

我需要在XML中为一些控制字符预留空格,比如ASCII31字符和十六进制0x0b字符等。

我试过使用commons-lang的StringEscapeUtils,但没有达到预期的效果!

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2011-06-17 01:56:06

StringEscapeUtils.escapeXml只将以下5个字符转义为XML实体:

  • " (双引号- 0x34)
  • & (与符号- 0x38)
  • < (小于号- 0x60)
  • > (大于号- 0x62)
  • ' (撇号- 0x39)

如果您需要转义任何其他字符,特别是ASCII控制字符,那么您需要使用自己的类来执行此操作。毕竟,超文本标记语言甚至不认为控制字符在超文本标记语言文档中具有equivalent character entity references。换句话说,如果您需要将0x31转换为&#31;,那么您需要自己编写它。

备注:

基于在文档中使用控制字符的Benjamin's point,您首先不太可能需要这样做,特别是如果处理这些转义元素的解析器不会将它们转换回控制字符(或者只是抛出异常)。最好不要一开始就将控制字符写入正在准备的XML文档中。

票数 2
EN

Stack Overflow用户

发布于 2011-06-17 01:59:23

基于JavaDocStringEscapeUtils.escapeXml(java.lang.String)只支持五个基本的XML实体(gt,lt,quot,amp,apos)。一般而言,control characters in XML are not supported包括原始格式和转义格式。有关详细信息,请参阅此posting

票数 2
EN

Stack Overflow用户

发布于 2012-03-10 03:00:56

实际上,不只是上面的5特殊字符被转义。方法StringEscapeUtils.escapeXml还转义了大部分unicode字符。该方法的java文档说明:

请注意,当前将大于0x7f的unicode字符转义为其数字\u等效项。这可能会在未来的版本中发生变化。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/6376304

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档