我需要从一些文本中删除括号和每组括号中的内容。
我想用正则表达式来做这件事。然而,我不知道关于Python中的re的第一件事。
另类投资解决方案的领先者text Direxion已任命安吉洛·皮尔里为其西北地区新的高级区域总监。(标识:http://photos.prnewswire.com/prnh/20100701/NY29766LOGO)皮里先生负责向所有渠道的财务顾问销售和分销Direxion的所有购买并持有的另类投资策略产品,包括有线电视公司、地区性经纪交易商、注册投资顾问公司和他所在地区的其他公司。皮里先生将为加利福尼亚州北部、俄勒冈州、华盛顿州、夏威夷、怀俄明州、爱达荷州、阿拉斯加州和蒙大拿州的顾问服务。
去掉括号里的东西...
我还没试过任何东西。我想要别人告诉我该做什么,我不想做任何工作。
发布于 2012-01-03 21:47:52
text = "Some sample (with parenthesis) text"
regEx = re.compile(r'([^\(]*)\([^\)]*\) *(.*)')
m = regEx.match(text)
while m:
text = m.group(1) + m.group(2)
m = regEx.match(text)
print text这只是一个格式化正确的正则表达式以匹配您的文本的问题...上面的操作将迭代地从字符串中删除多组括号,一次删除一组,但如果有嵌套的括号,则会失败。这是一个完全不同的问题。
发布于 2012-01-03 21:50:04
假设没有嵌套的括号:
import re
string = 'text (text) text (text) text'
regex = re.compile('\(.+?\)')
output = regex.sub('', string)
print(output)
# >>> text text texthttps://stackoverflow.com/questions/8713118
复制相似问题