我不想从给定的字符串中删除特殊字符。请告诉我如何修改我的regex变量,使它不会从我的中文句子中删除特殊字符。
例如,
这项治疗费用很高.
我不想删除这个“。字符从sentence>我如何使这工作?
很抱歉问了这么多问题,因为我刚开始编程。
def spliteKeyWord(str):
regex = r"[\u4e00-\ufaff]|[0-9]+|[a-zA-Z]+\'*[a-z]*"
matches = re.findall(regex, str, re.UNICODE)
return matches发布于 2018-05-26 22:40:59
“.”字符具有"\u3002“Unicode十六进制字符代码。只需将其添加到正则表达式中即可:
regex = r"[\u4e00-\ufaff,\u3002]|[0-9]+|[a-zA-Z]+\'*[a-z]*"https://stackoverflow.com/questions/50547280
复制相似问题