当我以如下方式运行python命令时:
z='From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008'
print(re.findall('\S+@\S+',z))我得到了
['stephen.marquard@uct.ac.za']当我再次运行它时,将?添加为:
z='From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008'
print(re.findall('\S+@\S+?',z))我得到了
['stephen.marquard@u']现在,我想打印出['d@uct.ac.za'],所以我运行了:
z='From stephen.marquard@uct.ac.za Sat Jan 5 09:14:16 2008'
print(re.findall('\S+?@\S+',z))然而,我收到了:
['stephen.marquard@uct.ac.za']我想我会收到['d@uct.ac.za'],因为?使+变得不贪婪。为什么我错了?
发布于 2018-12-16 05:52:00
当你这样做时:
re.findall('\S+?@\S+',z)它从一开始就尽量不贪婪,直到找到一个'@',然后再找到剩下的。'\S+?@'只需要从开始到'@'的所有字符。
在'\S+@\S+?'的例子中,您没有给出任何东西给?的右边,这意味着它使正则表达式更加非贪婪--只取一个。
假设,如果您给出类似'\S+?@\S+?\.' (在?之后的一个点),它遵循类似于第一个场景的规则--尽量不贪婪,直到它看到一个. (点)。
https://stackoverflow.com/questions/53799727
复制相似问题