我喜欢使用Python,因为它的语法易于学习,然而,我最近了解到它在CSV领域不支持UTF-8。由于我经常使用CSV,这对我来说似乎是一个严重的问题。当我需要管理非常大的CSV UTF-8文件时,有没有另一种语法简单的脚本语言可以让我学习?
发布于 2011-11-05 17:36:55
我推荐使用gawk。例如:
awk -F ";" '{print $1 ";" $2}' FILE.csv将打印FILE.CSV的前两列(以;分隔)。
LC_ALL=C awk 'BEGIN {print length(“árvíztűrőtükörkúrék”)}‘=> 30 => awk 'BEGIN {print length(“árvíztűrőtükörkürék”)}’print length(“árvíztűrőtükörkúpék”)}‘print length(“árvíztűrőtükörkópék”)}’print length(“árvíztűrőtükörkópék”)}‘print length(“árvíztűrőtükörkórék”)}’print length(
(或者,如果您一直在使用UTF-8,并且在*nix上,例如在.bashrc、export LC_ALL=en_US.utf8中,则可以全局设置LC_ALL。)
awk是一个很老的工具,但是功能非常强大,而且速度很快。
HTH
发布于 2011-11-05 18:35:47
如果您正在使用该命令,并且可以安装另一个命令行工具,我强烈建议您使用csvfix。
安装后,您可以强大地查询任何csv文件,例如
csvfix order -f 1,3 file.csv将提取csv的第1列和第3列。
这里有一个完整的命令列表here
请参阅相关的question
https://stackoverflow.com/questions/8019084
复制相似问题