我的问题与不区分大小写的正则表达式搜索有关。下面是我编写的代码的一部分:
engType = 'XM665'从其他文件中提取engType的值。基于engType,我希望在另一个文本文件中找到包含该部分的行,并从该行中提取描述信息,说明部分将位于engType字符串和'Serial'之间。
例如:
lines = ['xxxxxxxxxxx','mmmmmmmmmmm','jjjjj','xM665 Module 01 Serial (10-11)']
pat = re.compile(engType+'(.*?)[Ss][Ee][Rr][Ii][Aa][Ll]')
for line in lines:
des = pat.search(line).strip()
if des:
break;
print des.group(1).strip()我知道结果将是一个错误,因为我的字符串engType的情况与'xM665 Module 01 Serial (10-11)'中的情况不同,我知道我可以使用[Ss]进行不区分大小写的比较,就像我在pat的最后一部分中所做的那样。但是,由于我的engType是一个变量,所以不能将它应用于变量。我知道我可以在更低的情况下搜索,比如:
lines = ['xxxxxxxxxxx','mmmmmmmmmmm','jjjjj','xM665 Module 01 Serial (10-11)']
pat = re.compile(engType.lower()+'(.*?)serial')
for line in lines:
des = pat.search(line.lower()).strip()
if des:
break;
print des.group(1).strip()结果:
module 01现在的情况与Module 01不同了。如果我想保留这个案子,我该怎么做?谢谢!
发布于 2013-11-22 05:22:22
re.IGNORECASE是你要找的旗子。
pat = re.compile(engType+'(.*?)[Ss][Ee][Rr][Ii][Aa][Ll]',re.IGNORECASE)或者,更简单地说是re.compile(engType+'(.*?)serial',re.IGNORECASE)。
此外,这一行中的bug:
des = pat.search(line.lower()).strip()删除.strip();如果pat.search()是None,您将得到一个AttributeError。
发布于 2013-11-22 05:27:31
查看re.IGNORECASE in http://docs.python.org/3/library/re.html
我相信它会看起来像:
pat = re.compile(engType.lower()+'(.*?)serial', re.IGNORECASE)https://stackoverflow.com/questions/20137473
复制相似问题