我有一个句子清单如下:
[不,第二主4 a交叉,uas布局,靠近甘尼萨寺/ bsnl交换,sanjaynagar,班加罗尔“,
‘格里哈拉克希米公寓公寓,南端路巴萨万古迪班加罗尔-560004。opp adiyar ananda bhavan在c‘南部,
“srinivas pg acomudation ;opp to宇宙商城brooke field”,
“皇家棕榈2号交叉,l b sastry nagar bangalore”
‘bmp ho名称: grija \krishnappa花园.technologi公园cv ramanagar']
除…以外,我需要删除所有标点符号。我使用string.punctuation删除所有
def punc(x):
predicate = lambda y:y not in string.punctuation
out = filter(predicate,x)
return out
data = data.apply(punc)这个移除了一切..。要删除选定的ones..plz帮助
当.apply()是dataframe的一部分时,我使用了它。现在我把它转换成一个列表。因此,请重新推荐一种处理列表对象中异常标点符号的技术。
发布于 2014-02-07 04:32:46
尝尝这个
def punc(x):
predicate = lambda y:y not in ''.join(c for c in string.punctuation if c not in ',/')
out = filter(predicate,x)
return out另外,反对使用()。
当介词在字符串中时移除。
def punc(x):
predicate = lambda y:y not in ''.join(c for c in string.punctuation if c not in './')
prepositions = ['a', 'in'] #define by yourself
if any(p in x.split() for p in prepositions):
return filter(predicate,x)
return xhttps://stackoverflow.com/questions/21619267
复制相似问题