我有一个带有逗号分隔符的CSV文件,需要删除字符串中的这个分隔符来操作数据。
该文件如下:
Col1,Col2,Col3,Col4
"xx,yy,ww",美国
"abc,ww",美国
115,05地质学,“地质”,CA
我需要扫描字符串来替换分隔符,但不知道如何继续。我试过sed‘s/,/ "/g’(使用MacOS10.10)
因此,当我试图保留某些列时,我无法达到预期的结果: cut -d,-f 2,3 myfile.csv > newfile.csv
我得到了:
08科学,"xx
06文化"abc“
05地质学,“地质”
而不是
08科学,"xx,yy,ww“
06文化,"abc,ww“
05地质学,“地质”
有什么帮助吗?
发布于 2018-02-26 23:27:03
当您想要第二和第三列时,请使用
sed 's/[^,]*,//;s/,[^,]*//' inputfile
# or
sed 's/[^,]*,\(.*\),.*/\1/' inputfile
# or removing space before col3
sed 's/[^,]*, *\(.*\),.*/\1/' inputfile发布于 2018-02-27 09:06:35
假设第三列由" "组成
$ awk -F"," -v OFS="," '{match($0,/\".*\"/,a); print $2 OFS a[0]}' file
08 sciences,"xx, yy, ww"
06 culture,"abc, ww"
05 geology,"geology"发布于 2018-02-27 09:23:06
我认为您希望在双引号中用空格替换逗号。
如果是这样的话,请使用awk并告诉它字段是用双引号分隔的,您希望用字段2中的空格替换逗号,如下所示:
awk -F'"' '{gsub(/,/," ",$2)}1' OFS='"' yourFile样本输出
100, 08 sciences, "xx yy ww", US
110, 06 culture, "abc ww", US
115, 05 geology, "geology", CAhttps://stackoverflow.com/questions/48995878
复制相似问题