在RegExr.com中,在示例部分,有一个2-5字母回文的代码。在Python中使用完全相同的模式似乎并不能像RegExr那样捕获所有的结果!
Python不会捕获少于4个字符的单词,比如‘爸爸’和'555‘。代码是
\b(\w)?(\w)\w?\2\1这些不同结果的原因是什么?
发布于 2016-04-02 12:41:20
当第一个捕获组被重复时,它与Python中的条件一起工作:
\b(\w)?(\w)\w?\2(?(1)\1)
(?(1)\1)转换为:如果第一个捕获组成功,则再次匹配第一个捕获组。
这种差异很可能是因为正则表达式引擎对可选的非匹配捕获组的处理方式不同。例如,RegExr在浏览器中使用JavaScript引擎,它将空捕获组视为未定义的。当再次尝试在字符串末尾匹配未定义的字符串时,它将成功。但是,在Python中,它是不同的,只有在可选捕获组成功的情况下才能再次成功匹配。这仅仅取决于实现细节。
https://stackoverflow.com/questions/36373110
复制相似问题