在python上需要帮助,我有一个包含中文和英语的字符串,我想删除中文字符之间的空白,而不是英文单词之间的空白。
从- "u'\u5c0f \u5973 \u4eca \u4e74 \u4fc2 dse \u8003 \u751f \u5979 \u559c \u6b61电影of \u524d \u5e7e \u65e5在buasso电影of和数字媒体研究中提供\u4f46 \u60f3 \u554f3 \u5982 \u679c,通过jupas openu \u6536 \u5979 \u8b 80提供具有创作和电影创作荣誉的艺术“。
至-“u‘u5c0f\u5973\u4eca\u4e74\u4fc2 dse \u8003\u751f\u5979\u559c\u6b61电影to \u524d\u5e7e\u65e5 in \u5de6 buasso电影to和数字媒体研究\u5f2\u 7d93条件提供\u4f46\u60f3\u554f3\u5982\u679c,通过jupas openu \u6536\u5979\u8b 80提供具有创作和剪辑荣誉的艺术”。
仅在两个unicode字符之间删除空白
发布于 2017-03-30 14:44:53
如果您可以将"unicode字符“定义为”非ASCII“字符,那么您可以使用负前瞻/后视进行此操作。
re.sub("(?<![ -~]) (?![ -~])", "", text)如果您不喜欢使用的范围( -~),那么这个问题有其他的选择。此外,还有各种各样的unicode类别可以更好地服务于您的目的,但据我所知,您仍然需要手动定义字符范围,因为它们在re模块中不受支持。
https://stackoverflow.com/questions/43119770
复制相似问题