我只想从()周围的缩略语中得到完整的单词。
例如,有句话“肺癌筛查降低非小细胞肺癌死亡率”;->I希望因此获得“肺癌筛查”。
我怎么才能用regex做这件事?
原始问题:我想删除重复的上字母:"HIV后天免疫缺陷综合症患子宫颈癌的风险特别高“,”=>“后天免疫缺陷综合症患子宫颈癌的风险特别高。
发布于 2022-11-27 08:52:15
假设您希望针对2个或更多大写字母,我将在这里使用re.sub:
inp = "Lung cancer screening (LCS) reduces NSCLC mortality"
output = re.sub(r'\s*(?:\([A-Z]+\)|[A-Z]{2,})\s*', ' ', inp).strip()
print(output) # Lung cancer screening reduces mortality发布于 2022-11-27 09:01:42
import re
s = 'HIV acquired immunodeficiency syndrome are at a particularly high risk of cervical cancer'
print(re.sub(r'([A-Z])', lambda pat:'', s).strip()) # Inlinehttps://stackoverflow.com/questions/74588659
复制相似问题