首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在替换双引号中的分隔符时处理数据

在替换双引号中的分隔符时处理数据
EN

Stack Overflow用户
提问于 2019-07-22 23:19:21
回答 1查看 29关注 0票数 0

我正在尝试删除双引号中的竖线分隔符,将其替换为以下代码,但它不处理空字段和数字字段。任何帮助都将不胜感激。

代码:

代码语言:javascript
复制
 sed 's/|*\([^"]\)/\1/g;s/\([^"]\),*/\1/g' test.csv

输入:

代码语言:javascript
复制
"Southern|Palms"|"AA|None"|"4"|"Kenya"|"MBA"|"Ken|Coast"|"Y"|1/11/2019 00:00:00|30/4/2020 00:00:00|"TH"||40.00|"HB|AI"||||||"Y"||||

输出:

代码语言:javascript
复制
"SouthernPalms"|"AANone"|"4"|"Kenya"|"MBA"|"KenCoast"|"Y"1/11/2019 00:00:0030/4/2020 00:00:00|"TH"40.00|"HBAI"|"Y"|

预期输出:

代码语言:javascript
复制
"Southern Palms"|"AA None"|"4"|"Kenya"|"MBA"|"Ken Coast"|"Y"|1/11/2019 00:00:00|30/4/2020 00:00:00|"TH"||40.00|"HB AI"||||||"Y"||||
EN

回答 1

Stack Overflow用户

发布于 2019-07-22 23:56:30

代码语言:javascript
复制
sed -E 's/(^|[^"|])\|($|[^"|])/\1 \2/g' <file>

返回:

代码语言:javascript
复制
"Southern Palms"|"AA None"|"4"|"Kenya"|"MBA"|"Ken Coast"|"Y"|1/11/2019 00:00:00 30/4/2020 00:00:00|"TH"||40.00|"HB AI"||||||"Y"||||

它不适用于这样的代码行,我相信还有很多其他的例子可能会破坏regexp:

代码语言:javascript
复制
"Southern|Palms"|"AA|||None"|"4"|"Kenya"|"MBA"|"Ken|Coast"|"Y"|1/11/2019 00:00:00|30/4/2020 00:00:00|"TH"||40.00|"HB|AI"||||||"Y"||||

但是awk/sed不是用quotechar和escapechar来读取csv的合适工具。对于像这样的复杂文件,我会考虑使用python或任何考虑到这些选项的CSV阅读器。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57149092

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档