我需要regex从数据集中的字符串中筛选出特定的字符。如何在数字之间过滤数字数字和"-“符号,在字母字符之间跳过"-”符号,导致我现在使用的正则表达式除数字字符之间的"-“符号外,还过滤掉任何字母数字字符之间的每个”-“符号。
示例:
问题:“非营利组织管理,100-200名员工”当前的结果:"NonProfit组织管理,员工“期望的结果:”非营利组织管理,员工“。
if 'business' in row.keys():
row['business'] = re.sub("[0-9-][0-9]*", '', str(row['business']))发布于 2021-09-22 01:39:03
您需要使用表达式\d+-\d+来用空字符串替换all -包括数字(\d)。
print(re.sub("\d+-\d+ *", "", "Non-Profit Organization management, 100-200 employees"))“非营利性组织管理,员工”
注意到,我将*添加到模式中,以便删除数字后面的空格。
建议:如果您多次执行此操作,我建议您执行以下操作:
import re
pattern = re.compile("\d+-\d+ *")
print(pattern.sub("", "Non-Profit Organization management, 100-200 employees"))因此Python不需要每次编译模式。
https://stackoverflow.com/questions/69277189
复制相似问题