在执行了生成伪xml的java代码之后,我应该转换xml语言中的标记"&“和"<”,即"&“和"<”。
我的代码行看起来如下:
os.system('java -jar de.unihd.dbs.heideltime.standalone.jar ' + file + ' -l german | sed -e "s/&/&/g" | sed -i "{ s/</</g } /^[\?TDA\/]/!" > ' + taggedname)第一部分--更改"<“中的所有"&”--工作。但是"<"-sign的部分还不能工作。本部分应将所有"<“改为"?”、"T“、"D”、"A“或"/”为"&alt;“。如何才能正确地做到这一点?
谢谢你的帮助!
发布于 2014-04-21 20:46:14
尝试使用珀尔而不是sed。它具有类似的语法,但具有前瞻性和前瞻性断言:
perl -pe 's{&}{&}g; s{<(?![?TDA/])}{&alt;}g'https://stackoverflow.com/questions/23204937
复制相似问题