我正在尝试为我的应用程序设计日志文件解析器。我有数以千计的日志文件具有相同的数据模式,我的目标是首先解析数据并将其存储在数据库中。
日志文件具有以下模式-
a=some_value_1 b=some_value_2 c=some_value_3 d=some_value_4
a=some_value_5 b=some_value_6 c=some_value_7 d=some_value_8
a=some_value_9 b=some_value_10 c=some_value_11 d=some_value_12
a=some_value_13 b=some_value_14 c=some_value_15 d=some_value_16我最初的想法是使用InputStreamReader逐行读取所有文件,对于每一行中的每个文件,选择数据并将其提取到db。看起来对一些文件很好,但性能方面我需要改进我的设计。有没有人能对此提出一些更好的设计模型/架构呢?
发布于 2012-08-03 03:01:43
我建议使用BufferedReader而不是InputStreamReader。现在你的任务中的解析部分似乎不是很难。
发布于 2012-08-03 03:10:15
模式很棒,但您应该只在有意义的时候才使用它们。这里不需要特殊的模式:只需迭代文件;对于每个文件,读取它,并根据需要执行插入。使用main[]方法的单个文件/类中,程序占用的行数不应超过50行。小而干净的代码比复杂的大代码要好得多。
https://stackoverflow.com/questions/11784032
复制相似问题