首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >python移除中文unicode字符串之间的空格,但不删除英文单词之间的空格。

python移除中文unicode字符串之间的空格,但不删除英文单词之间的空格。
EN

Stack Overflow用户
提问于 2017-03-30 13:45:26
回答 1查看 763关注 0票数 0

在python上需要帮助,我有一个包含中文和英语的字符串,我想删除中文字符之间的空白,而不是英文单词之间的空白。

从- "u'\u5c0f \u5973 \u4eca \u4e74 \u4fc2 dse \u8003 \u751f \u5979 \u559c \u6b61电影of \u524d \u5e7e \u65e5在buasso电影of和数字媒体研究中提供\u4f46 \u60f3 \u554f3 \u5982 \u679c,通过jupas openu \u6536 \u5979 \u8b 80提供具有创作和电影创作荣誉的艺术“。

至-“u‘u5c0f\u5973\u4eca\u4e74\u4fc2 dse \u8003\u751f\u5979\u559c\u6b61电影to \u524d\u5e7e\u65e5 in \u5de6 buasso电影to和数字媒体研究\u5f2\u 7d93条件提供\u4f46\u60f3\u554f3\u5982\u679c,通过jupas openu \u6536\u5979\u8b 80提供具有创作和剪辑荣誉的艺术”。

仅在两个unicode字符之间删除空白

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-03-30 14:44:53

如果您可以将"unicode字符“定义为”非ASCII“字符,那么您可以使用负前瞻/后视进行此操作。

代码语言:javascript
复制
re.sub("(?<![ -~]) (?![ -~])", "", text)

如果您不喜欢使用的范围( -~),那么这个问题有其他的选择。此外,还有各种各样的unicode类别可以更好地服务于您的目的,但据我所知,您仍然需要手动定义字符范围,因为它们在re模块中不受支持。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43119770

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档