我的代码:
import re
print(re.findall(r'(?=(Deportivo))(?!.*\bla\b)','Deportivo coruna'))
print(re.sub(r'(?=(Deportivo))(?!.*\bla\b)','','Deportivo coruna'))如果字符串中没有'la‘,我有兴趣删除'Deportivo’。
例如:
re.findall(r'(?=(Deportivo))(?!.*\bla\b)','Deportivo coruna')返回“Deportivo”和
re.findall(r'(?=(Deportivo))(?!.*\bla\b)','Deportivo la coruna')returns []
然而,
re.sub(r'(?=(Deportivo))(?!.*\bla\b)','','Deportivo coruna')返回'Deportivo coruna',字符串保持不变。我不明白为什么,请帮帮忙。
发布于 2021-11-05 16:18:53
findall和sub的工作方式是不同的。根据the docs的说法,re.findall()将返回捕获组的内容,即使匹配结果本身是空字符串(在您的示例中也是空字符串,因为正则表达式完全由先行断言组成)。
因此,如果您希望在且仅当文本不包含la时从文本中删除Deportivo,则可以使用
re.sub(r'^(?!.*\bla\b)(.*?)Deportivo)',r'\1','Deportivo coruna')但是,这只会删除第一次出现的内容,改变这一点并不容易,因为在后视断言中需要无限的重复,而Python不支持这种情况。记录在案,
re.sub(r'^(?<!\bla\b.*)Deportivo(?!.*\bla\b)','','Deportivo coruna')可以做到这一点,但是这个正则表达式不能在Python中编译。
因此,您最好的选择可能是分两步完成。首先,检查字符串是否不包含la。然后用空字符串替换所有Deportivo。
https://stackoverflow.com/questions/69855960
复制相似问题