首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用vtd-xml从xml文件中删除注释,删除注释

使用vtd-xml从xml文件中删除注释,删除注释
EN

Stack Overflow用户
提问于 2015-08-17 16:02:49
回答 1查看 569关注 0票数 1

是否有办法从vtd-xml解析的大型xml文件(>200 MB)中删除注释?

都是根元素之前的注释。

代码语言:javascript
复制
<!-- comment -->
<rootElement>
.
.
.
 </rootElement>

和内部的评论

代码语言:javascript
复制
<rootElement>
<book>
<!-- comment -->
</book>
</rootElement>

最好的解决方案是使用xPath。我试过了

代码语言:javascript
复制
//comment()

,它适用于DOM,但不适用于vtd-xml。

下面是我选择注释的代码

代码语言:javascript
复制
String xPath = "//comment()"
XMLModifier xm = new XMLModifier();
VTDGen vg = new VTDGen();
if (vg.parseFile(fnIn,true)){
       VTDNav vn = vg.getNav();
       xm.bind(vn);
       nodeXpath(xPath,vn);
}

private void nodeXpath(String xPath, VTDNav vn) throws Exception{
    int result;

    AutoPilot ap = new AutoPilot();
    ap.selectXPath(xPath);
    ap.bind(vn);
    while((result = ap.evalXPath())!=-1){
        int p = vn.getText();

        if (p!=-1) {                
            System.out.println(vn.getText() + ", " + vn.toString(p));               
        }
    }
}

但这里什么都没有印出来。

有什么方法可以用vtd xml来实现吗?

谢谢你的帮助。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-08-19 16:36:22

你说过你的代码不会在屏幕上打印任何东西.连逗号都没有?我不认为它会从getText()中打印任何东西,因为getText()文档似乎表明它返回“类型字符数据或CDATA",我认为它不包括注释的内容。(谢谢您,@vtd-xml-作者,确认了这一点。)

一个很好的测试是在 p = vn.getText()之前,在while循环p = vn.getText()的每一次迭代中打印一些东西,这样您就可以知道它是否找到了注释。

如果它正在查找注释,我想您会希望在每个评论上调用xm.removeToken(result)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32054846

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档