我尝试使用Univocity CSV解析带有引号的CSV,我发现在解析后,某些值中缺少右引号。
CSV:
ACCT,NAME,AGE,ADDRESS
700,GINI,23,"AB,ECITY-1"
800,HANNAH,30,"AB,ECITY-1"
900,IAN,40,"XYZ,ECITY-1"
1900,LYDIA,40,"XYZ,ECITY-1"输出:
[GINI, "AB,ECITY-1]
[HANNAH, "AB,ECITY-1]
[IAN, "XYZ,ECITY-1]
[LYDIA, "XYZ,ECITY-1]
CsvParserSettings settings = new CsvParserSettings();
settings.getFormat().setLineSeparator("\n");
settings.setKeepQuotes(true);
settings.setQuoteDetectionEnabled(false);
settings.trimValues(true);
settings.excludeFields(excludeHeaders.split("ACCT,AGE"));
CsvParser baseFileParser = new CsvParser(settings);
String[] baseRow;
baseFileParser.beginParsing(baseFile);
while((baseRow = baseFileParser.parseNext())!= null){
System.out.println(Arrays.toString(baseRow));
}我错过了什么。为什么输出中缺少右引号?
发布于 2017-10-11 13:20:49
找到答案myslef..我不得不删除下面这行
settings.getFormat().setLineSeparator("\n");如果删除上面的行,代码就可以正常工作
发布于 2017-10-19 10:02:47
您使用的是2.5.8版吗?如果不是,那么这看起来与我最近修复的a bug有关。只需更新它,它就会工作。
一个小小的解释:
在您的例子中,如果您设置了settings.getFormat().setLineSeparator("\n");,但是输入文件使用\r\n作为分隔符,那么bug就会显露出来。\r将由解析器作为空格处理,并触发错误。
这就是为什么删除settings.getFormat().setLineSeparator("\n");对你有用--如果你在Windows上,解析器使用的默认行分隔符将是\r\n。这将避免错误,因为在行结束之前没有尾随空格。
https://stackoverflow.com/questions/46680103
复制相似问题