首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >python通过多个分隔符和/或多个分隔符的组合拆分字符串

python通过多个分隔符和/或多个分隔符的组合拆分字符串
EN

Stack Overflow用户
提问于 2021-09-14 13:34:35
回答 2查看 1.4K关注 0票数 2

输入:

代码语言:javascript
复制
x = "121, 1238,\nxyz,\n 123abc \n\rabc123"

我想用分隔符",", "\n", "\r", "\s"分割这个字符串以获得输出

代码语言:javascript
复制
['121', '1238', 'xyz', '123abc', 'abc123']

无论我尝试什么,分隔符都被接受为单个字符,而不是字符的组合。例如:

1.

代码语言:javascript
复制
re.split("\n|,|\s|\r", x)

给出输出

代码语言:javascript
复制
['121', '', '1238', '', 'xyz', '', '', '123abc', '', '', 'abc123']

  1. re.split("\n\s|,|\s|\r", x)

给出输出

代码语言:javascript
复制
['121', '', '1238', '', 'xyz', '', '123abc', '', 'abc123']

第二项比第一项略有改进。但如果这是必需的,我需要手动提供所有可能的组合。

类似的东西(有更多的组合):

代码语言:javascript
复制
re.split("\n\s|\s\n|\s\n\s|\n|,\s|\s,|\s,\s|,|\s|\r", x)

产出:

代码语言:javascript
复制
['121', '1238', 'xyz', '', '123abc', '', 'abc123']

有什么更好的方法吗?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-09-14 14:11:23

结合@Johnny Mopp@alfinkel24的评论:

代码语言:javascript
复制
re.split("[\s,]+",  x)

将按需要将字符串拆分为

代码语言:javascript
复制
['121', '1238', 'xyz', '123abc', 'abc123']

解释:

  • [...]以前的characters.
  • \s中的任何一个或多个重复,任何空格字符,包括"\n, \r, \t"

正式文件:

\s

对于Unicode (str)模式:匹配Unicode空白字符(其中包括\t\n\r\f\v,以及许多其他字符,例如,许多语言中的排版规则规定的非中断空间)。如果使用ASCII标志,则只匹配\t\n\r\f\v。

对于8位(字节)模式:匹配ASCII字符集中视为空白的字符;这相当于\t\n\r\f\v.

票数 3
EN

Stack Overflow用户

发布于 2021-09-14 13:53:24

允许re.split将任何分隔字符的1次或多次重复作为分隔符:

代码语言:javascript
复制
>>> re.split("[,\s]+", x)
['121', '1238', 'xyz', '123abc', 'abc123']

(“*”、“+”和“?”限定符都是贪婪的,它们尽可能地匹配。)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69178811

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档