首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何使用flatpack解析大文件

如何使用flatpack解析大文件
EN

Stack Overflow用户
提问于 2015-03-30 11:14:44
回答 2查看 777关注 0票数 1

我需要解析可能非常大的文件,可能有上百兆字节和数百万行。我一直在尝试使用FlatPack来做到这一点。我认为实现这一点的方法应该是使用缓冲解析器和新的流方法。但是,尽管对于正确的记录数,dataset.next()返回true,但dataset.getRecord()返回的Optional从不包含值。

我看过这个example/test,但它只计算记录的数量,并不实际对内容做任何操作。示例/测试

EN

回答 2

Stack Overflow用户

发布于 2015-12-15 02:48:51

您可以使用类BuffReaderParseFactory而不是DefaultParserFactory。

只有当你调用"next()“时,它才会从输入文件中读取一条记录。

票数 0
EN

Stack Overflow用户

发布于 2016-04-07 14:57:39

对DefaultParserFactory和BuffReaderParseFactory的解释并不完全有帮助。这两个库都返回PZParser (来自newDelimitedParser),但其中只有一个库返回来自记录的实际值。根据我看到的例子,我认为BuffReaderParseFactory只是为了检查性能(因此应该更快),而DefaultParserFactory则包含了所有的记录。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29337845

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档