更具体地说,大型XML网页(RSS提要)。我正在使用优秀的罗马库来解析它们,但是我当前尝试获取的页面非常大,并且Java在获取整个文档之前耗尽了内存。
如何拆分网页,以便将其传递给XMLReader?我是不是应该自己动手,在添加完自己的XML之后,分块传递提要来开始和结束它们呢?
发布于 2010-07-14 00:42:31
首先,学习将Xms和Xmx的java命令行选项设置为适当的值,所有基于DOM的解析器都会占用大量内存。再看一下使用Pull Parser,它不必在处理文档之前将整个XML加载到文档中。
https://stackoverflow.com/questions/3239329
复制相似问题