我必须符合某一短语的某些标准,例如:(一组词)(之间的任何内容)(一组词):
(mirror|reflect|serve|adapt)(\s*\w+\s*\W*\s*)*?(population|client|customer|stakeholder|market|society|culture|consumer|end-user)因此,在任何时候,我有一个短语“镜像香蕉香蕉种群”,我想要匹配它。这是最好的解决办法吗?它容易出现灾难性的回溯吗?
发布于 2019-04-06 12:01:18
(\s*\w+\s*\W*\s*)*?部分可能导致灾难性的回溯,因为*?-quantified组中唯一的强制模式是\w+,并且它与其他可选模式(\s*和\W*可能匹配空字符串,并注意到像\s*\W*\s*这样的相邻*-quantified模式匹配相同的字符,这是导致灾难性回溯的错误做法)。
如果您mirror banana banannas populatio,您将得到灾难性的回溯错误。
在您的示例中,最好的regex方法是使用regex,例如,当您从JSON文件读取前导/尾随字列表时
(?:leading_word1|leading_word2|...|leading_wordN)(.*?)(?:trailing_word1|trailing_word2|...|trailing_wordN)您需要的值将在Group 1中,或者如果您使用re.findall,则列表中的所有值(您说您使用的是Python)。
https://stackoverflow.com/questions/55547210
复制相似问题