我正在尝试使用简单的正则表达式替换python中的字符串。这是我的代码:
>>> s = "num1 1 num2 5"
>>> re.sub("num1 (.*?) num2 (.*?)","1 \1 2 \2",s)我预计会出现类似这样的输出,其中\number将被替换为相应的组。
'1 1 2 5'然而,这是我得到的输出:
'1 \x01 2 \x025'我有点困惑,为什么\x0是他们的,而不是我想要的。非常感谢您的帮助
发布于 2012-05-19 01:47:33
您需要开始使用原始字符串(字符串以r为前缀):
>>> import re
>>> s = "num1 1 num2 5"
>>> re.sub(r"num1 (.*?) num2 (.*?)", r"1 \1 2 \2", s)
'1 1 2 5'否则,对于python和regex,您都需要对反斜杠进行转义,如下所示:
>>> re.sub("num1 (.*?) num2 (.*?)", "1 \\1 2 \\2", s)
'1 1 2 5'(这真的很老,真的很快,看看python regex docs的开头段落
发布于 2012-05-19 01:48:58
\1和\2被解释为八进制字符代码转义,而不仅仅是传递给正则表达式引擎。使用原始字符串r"\1"而不是"\1"可以防止这种解释。
>>> "\17"
'\x0f'
>>> r"\17"
'\\17'发布于 2012-05-19 01:50:43
正在字符串中解释\1。因此,您必须使用\自己的反斜杠对其进行转义:
>>> re.sub("num1 (.*?) num2 (.*?)", "1 \\1 2 \\2",s)
'1 1 2 5'您还可以使用原始字符串:
>>> re.sub("num1 (.*?) num2 (.*?)", r"1 \1 2 \2",s)
'1 1 2 5'https://stackoverflow.com/questions/10657355
复制相似问题