这个在我的shell脚本中
./osmfilter austria-latest.osm --keep="$key=$value" |
./osmconvert - --all-to-nodes --csv="@id @lat @lon @timestamp $key name" --csv-headline |
awk -F "\t" '{if($5 != "" && $6 != "") print "INSERT INTO nodes (name, timestamp, lat, lon, cid) VALUES (\"",$6,"\",\"",$4,"\",",$2,",",$3,","'$cid'");"}'
> $value.sql
sed -i '1d' $value.sql现在,有一行输出通常如下所示:
INSERT INTO nodes (name, timestamp, lat, lon, cid) VALUES (" OMV "," 2013-06-21T19:46:57Z ", 48.2160931 , 14.2793397 ,2);但是,如果在名称中有“或”,则将失败:
INSERT INTO nodes (name, timestamp, lat, lon, cid) VALUES (" "Landkauf" Bund "," 2014-01-04T10:42:33Z ", 46.7899638 , 15.8526000 ,2);我能告诉awk逃避所有“例如$6的输出吗?不一定是awk”
发布于 2014-01-24 13:05:11
您可以使用以下方法来转义所有":
awk '{gsub("\"", "\\\"", $6)}示例
$ echo '"Landkauf" Bund' | awk '{gsub("\"", "\\\"")}1'
\"Landkauf\" Bund合在一起
您目前正在使用
awk -F "\t" '{if($5 != "" && $6 != "") print "INSERT INTO nodes (name, timestamp, lat, lon, cid) VALUES (\"",$6,"\",\"",$4,"\",",$2,",",$3,","'$cid'");"}' 但可以将其重新格式化为:
awk -F "\t" '$5 && $6 {gsub("\"", "\\\"", $6); printf "INSERT INTO nodes (name, timestamp, lat, lon, cid) VALUES (\"%s\", \"%s\", \"%s\", \"%s\", \"%s\");\n", $6, $4, $2, $3, cid}' cid=$cid因为:
if($5 != "" && $6 != "")等同于$5 && $6。printf可以让您更好地控制打印内容。$cid您不能使用这样的bash变量。您必须使用cid,并将其与cid=$cid一起使用,如我的示例所示。发布于 2014-01-24 16:08:07
为此,您可以使用xxd & sed。大多数实用程序很难使用特殊字符,如引号和斜杠,所以用a\代替‘a \’会导致代码不可读。下面的命令将整个输入转换为十六进制,每行有一个十六进制字符。sed然后修改十六进制值,而不必担心特殊的字符。然后将数据转换回文本。
xxd -ps -c 1 input.txt | sed -e 's/22/5c22/g' -e 's/27/5c27/g' | xxd -r -p解释:
xxd -ps -c 1将输入文件转换为ascii的十六进制代码,每行一个字符。's/22/5c22/g'翻译“to”'s/27/5c27/g'翻译‘to \’xxd -r -p将十六进制恢复为文本字符并还原文件。https://stackoverflow.com/questions/21333396
复制相似问题