我需要修复一个错误,并将XML文件中的第二个标记</time>替换为</tags>,结构如下:
<time>20260664</time>
<tags>substancesummit ss</time>
<geo>asdsadsa</geo>
<time>20260664</time>
<tags>substancesummit ss</time>
<geo>asdsadsa</geo>我正在尝试使用sed来实现,因为每个项目有2个</time>结束标记,所以我的想法是用</tags><geo>替换</time><geo>。
但是,中间有一个下一行符号,所以我使用了\n,但它不起作用:
sed 's/time>\n<geo>/tags>\n<geo>/g' old.xml > new.xml有什么帮助吗?
发布于 2011-04-23 23:57:51
您可以在一个sed命令中做到这一点,如下所示:
sed '/<\/time>/I{n;:A;N;h;/<geo>/I!{H;bA};/<geo>/I{g;s/<\/time>/<\/tags>/i}}' file.txt测试
如果您的输入file.txt如下:
<time>20260664</time>
<tags>substancesummit ss
</time>
<Geo>asdsadsa</geo>
<time>30260664</time>
<tags>substancesummit st</timE>
<geo>bsdsadsa</geo>则上述命令的输出为:
<time>20260664</time>
<tags>substancesummit ss
</tags>
<Geo>asdsadsa</geo>
<time>30260664</time>
<tags>substancesummit st</tags>
<geo>bsdsadsa</geo>它涵盖了</time>和<geo>之间任意组合的多个换行符(\r或\n
PS:上面的sed命令正在做ignore care搜索/替换,如果你不想这样做,那么就从sed命令中删除I标志,或者让我知道。
发布于 2011-04-24 00:04:53
使用以下命令:
$ sed -n '1h; 1!H; $ {g; s/<\/time>\n<geo>/<\/tags>\n<geo>/g; p;}' file发布于 2011-04-24 00:46:14
如果文件中有一个您绝对不使用的字符,请尝试用它替换\n,然后执行sed工作并替换回来。tr在这方面做得非常好
cat old.txt | tr '\n' '#' | sed 's/time>#<geo>/tags>#<geo>/g' | tr '#' '\n' > new.txt我使用#作为替换字符。
https://stackoverflow.com/questions/5764885
复制相似问题