我正在尝试删除双引号中的竖线分隔符,将其替换为以下代码,但它不处理空字段和数字字段。任何帮助都将不胜感激。
代码:
sed 's/|*\([^"]\)/\1/g;s/\([^"]\),*/\1/g' test.csv输入:
"Southern|Palms"|"AA|None"|"4"|"Kenya"|"MBA"|"Ken|Coast"|"Y"|1/11/2019 00:00:00|30/4/2020 00:00:00|"TH"||40.00|"HB|AI"||||||"Y"||||输出:
"SouthernPalms"|"AANone"|"4"|"Kenya"|"MBA"|"KenCoast"|"Y"1/11/2019 00:00:0030/4/2020 00:00:00|"TH"40.00|"HBAI"|"Y"|预期输出:
"Southern Palms"|"AA None"|"4"|"Kenya"|"MBA"|"Ken Coast"|"Y"|1/11/2019 00:00:00|30/4/2020 00:00:00|"TH"||40.00|"HB AI"||||||"Y"||||发布于 2019-07-22 23:56:30
sed -E 's/(^|[^"|])\|($|[^"|])/\1 \2/g' <file>返回:
"Southern Palms"|"AA None"|"4"|"Kenya"|"MBA"|"Ken Coast"|"Y"|1/11/2019 00:00:00 30/4/2020 00:00:00|"TH"||40.00|"HB AI"||||||"Y"||||它不适用于这样的代码行,我相信还有很多其他的例子可能会破坏regexp:
"Southern|Palms"|"AA|||None"|"4"|"Kenya"|"MBA"|"Ken|Coast"|"Y"|1/11/2019 00:00:00|30/4/2020 00:00:00|"TH"||40.00|"HB|AI"||||||"Y"||||但是awk/sed不是用quotechar和escapechar来读取csv的合适工具。对于像这样的复杂文件,我会考虑使用python或任何考虑到这些选项的CSV阅读器。
https://stackoverflow.com/questions/57149092
复制相似问题