我有以下字符串:
This$#is% Matrix# %!我正在尝试捕捉在字母数字字符之间出现特殊符号/空格的子串。例如,我的目标是找到这两组子字符串:This$#is ( 'This‘和' is’之间的特殊符号#,$)和is% Matrix (‘is’和‘Matrix’之间的特殊符号%和空白)。
我的regex findall如下所示:
match = re.findall(r'([\w]{1,})([\s\W]{1,})([\w]{1,})', temp)它返回的是me:[('This', '$#', 'is')],而不是第二部分的('is% Matrix')。我有什么地方做错了吗?
如果我将字符串更改为'is% Matrix‘并应用相同的正则表达式模式,则会得到以下结果:[('is', '% ', 'Matrix')]。
发布于 2018-08-30 13:27:12
您可以在希望具有重叠匹配的零件上使用正向先行:
match = re.findall(r'([\w]{1,})([\s\W]{1,})(?=([\w]{1,}))', temp)match变成:
[('This', '$#', 'is'), ('is', '% ', 'Matrix')]https://stackoverflow.com/questions/52089036
复制相似问题