首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >LF和CR LF组合时的XMLFormatter问题

LF和CR LF组合时的XMLFormatter问题
EN

Stack Overflow用户
提问于 2017-11-24 19:56:46
回答 2查看 1.4K关注 0票数 1

我正在使用dom4j Outpurformat和Document对象进行XML格式。

如果为Win -> \r\n and Linux -> \n,我将根据操作系统设置行分隔符

如果我通过单行xml文件,它可以很好地工作,得到预期的终止(CR LF)。

但是如果我传递多行xml文件,不管现有的行是什么(LF),新的行都是(CR LF)

例如:输入文件:

代码语言:javascript
复制
    <root>
      <emp>
        <name>myname</name>
      </emp>
    </root>

输出:

代码语言:javascript
复制
    <root> LF
    CR LF
      <emp>LF
    CR LF
        <name>myname</name>LF
    CR LF
      </emp>LF
    CR LF
    </root>LF
    CR LF

我已经试过更换EOL了,但还是不能工作,两种方法都试过了

代码语言:javascript
复制
xmlContent= xmlContent.replaceAll("\n","\r\n")
xmlContent = xmlContent.replaceAll("\\n","\r\n")

正如预期的那样,它在linux中一直运行良好,但上面提到的问题是在windows主机上。它伴随着LF和CF LF的组合。

EN

回答 2

Stack Overflow用户

发布于 2017-11-24 20:02:53

字符串在java中是不可变。因此必须替换换行符并将其赋值给变量。

  • CR = \r;-回车
  • LF = \n;-换行符
  • CRLF = \r\n -行尾

xmlContent = xmlContent.replaceAll("\r\n","").repalceAll("\n","").repalceAll("\r","");;

票数 0
EN

Stack Overflow用户

发布于 2017-11-24 20:57:01

在我看来,dom4j的行为是正确的。它只是在缩进输出时添加换行符(对于windows操作系统是CR+LF)。额外的LF来自原始文件(我猜它使用unix约定)。xml解析器将输入中的LF解释为文本节点,因此您也可以在输出中获取它们。如果你试着

代码语言:javascript
复制
xmlContent = xmlContent.replaceAll("\x0a","")

否则,可以将xml阅读器配置为忽略空格

代码语言:javascript
复制
SAXReader xmlReader = new SAXReader();
xmlReader.setStripWhitespaceText(true);

但这也会影响元素内部的空格。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/47472826

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档