文章/答案/技术大牛

发布

社区首页 >问答首页 >Python-Regex，这是怎么回事？

问Python-Regex，这是怎么回事？
EN

Stack Overflow用户

提问于 2009-01-11 18:36:21

回答 6查看 1.4K关注 0票数 6

我最近得到了一本关于python的书，其中有一章是关于Regex的，有一段代码我真的不能理解。有人能解释一下这里到底发生了什么吗(这一部分是关于Regex组的)？

>>> my_regex = r'(?P<zip>Zip:\s*\d\d\d\d\d)\s*(State:\s*\w\w)'
>>> addrs = "Zip: 10010 State: NY"
>>> y = re.search(my_regex, addrs)
>>> y.groupdict('zip')
{'zip': 'Zip: 10010'}
>>> y.group(2)
'State: NY'

python

regex

回答 6

Stack Overflow用户

回答已采纳

发布于 2009-01-11 18:54:18

正则表达式定义：

(?P<zip>...)

创建一个命名组"zip“

Zip:\s*

匹配"Zip:“和零个或多个空格字符

\d

匹配数字

\w

匹配单词字符A-Za-z0-9_

y.groupdict('zip')

groupdict方法返回一个字典，其中命名的组作为键，它们的匹配项作为值。在这种情况下，将返回"zip“组的匹配项

y.group(2)

返回第二个组的匹配项，这是一个未命名的组"(...)“

希望这能有所帮助。

票数 8

Stack Overflow用户

发布于 2009-01-11 18:52:39

正则表达式搜索方法将返回一个包含正则表达式模式结果的对象。

groupdict返回组的字典，其中键是由(?P...)定义的组名。此处的名称是组的名称。

group返回匹配的组列表。"State: NY“是你的第三个小组。第一个是整个字符串，第二个是"Zip: 10010“。

顺便说一下，这是一个相对简单的问题。我只是在谷歌上查阅了方法文档，找到了this page。谷歌是你的朋友。

票数 2

Stack Overflow用户

发布于 2009-01-11 18:57:17

# my_regex = r' <= this means that the string is a raw string, normally you'd need to use double backslashes
# ( ... ) this groups something
# ? this means that the previous bit was optional, why it's just after a group bracket I know not
# * this means "as many of as you can find"
# \s is whitespace
# \d is a digit, also works with [0-9]
# \w is an alphanumeric character
my_regex = r'(?P<zip>Zip:\s*\d\d\d\d\d)\s*(State:\s*\w\w)'
addrs = "Zip: 10010 State: NY"

# Runs the grep on the string
y = re.search(my_regex, addrs)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/433388

复制

相似问题

问Python-Regex，这是怎么回事？
EN

回答 6

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python-Regex，这是怎么回事？EN

回答 6

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python-Regex，这是怎么回事？
EN