首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >XmlSlurper转换html编码的符号

XmlSlurper转换html编码的符号
EN

Stack Overflow用户
提问于 2016-08-29 19:53:02
回答 1查看 477关注 0票数 1
代码语言:javascript
复制
def xmlNode = new XmlSlurper().parseText('<?xml version="1.0" encoding="utf-8"?><b>&#8240;</b>')
println XmlUtil.serialize(xmlNode)

打印下一页:

代码语言:javascript
复制
<?xml version="1.0" encoding="UTF-8"?>
<b>
  ‰
</b>

有没有办法防止将&#8240;转换成XmlSlurper文档什么也没说。

EN

回答 1

Stack Overflow用户

发布于 2016-08-29 21:17:00

我编写了一个覆盖XmlSlurper.characters的POC来处理字符实体。将转换回实体代码也需要Apache commons StringEscapeUtils

代码语言:javascript
复制
@Grab(group='commons-lang', module='commons-lang', version='2.6')

import org.apache.commons.lang.StringEscapeUtils as SE
import groovy.xml.XmlUtil

def parser = new XmlSlurper() {
    void characters(char[] buffer, int start, int length)  {
        def entity = SE.escapeXml(buffer[start].toString())
        super.characters entity.toCharArray(), start, entity.size() 
    }
}

def xml = parser.parseText '<?xml version="1.0" encoding="utf-8"?><b>&#8240;</b>'

def serialized = SE.unescapeXml( XmlUtil.serialize(xml) )
assert '<?xml version="1.0" encoding="UTF-8"?><b>&#8240;</b>\n' == serialized

注意,这是在处理单个字符,如果需要处理多个字符,您可能需要对其进行一些调整。还要注意,在assert中需要换行符。是由XmlUtil.serialize添加的

不过,我不知道这是不是最好的方法。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/39205695

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档