我正在尝试创建一个svn预提交钩子,但无法让我的正则表达式按预期工作。对于看起来不像"DEV-5 | some message“的消息,它应该打印False。为什么我在这里得到True?
Python 2.7.1+ (r271:86832, Apr 11 2011, 18:05:24)
[GCC 4.5.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import re
>>> p = re.compile("^\[[A-Z]+-[0-9]+\] | .+$", re.DOTALL)
>>> message = "test message"
>>> match = p.search(message)
>>> bool(match)
True发布于 2011-09-21 16:55:59
>>> p = re.compile("^[A-Z]+-[0-9]+ \| .+$", re.DOTALL)
>>> print p.search("test message")
None
>>> print p.search("DEV-5 | some message")
<_sre.SRE_Match object at 0x800eb78b8>\]
|,
\[发布于 2011-09-21 16:57:36
罪魁祸首是尾随的“| .+$”,它匹配‘message’作为第一个正则表达式的替代。就像罗曼指出的那样,你的意思是匹配文字'|‘,所以你必须将它转义为'|’。
要查看匹配的内容,您可以执行以下操作:
print match.group()
' message'(顺便说一下,只处理包含竖线的行的一种更快的非正则表达式方法是使用line.split('|'):
for line in ...:
parts = line.split('|',1)
if len(parts)==1: continue
(code,mesg) = parts发布于 2011-09-21 16:55:12
我还没有运行代码,但我怀疑regexp中alternative (|)后面的部分与任何以空格开头的非空字符串匹配,在本例中为" message"。
https://stackoverflow.com/questions/7497048
复制相似问题