文章/答案/技术大牛

发布

社区首页 >问答首页 >python通过多个分隔符和/或多个分隔符的组合拆分字符串

问python通过多个分隔符和/或多个分隔符的组合拆分字符串
EN

Stack Overflow用户

提问于 2021-09-14 13:34:35

回答 2查看 1.4K关注 0票数 2

输入：

x = "121, 1238,\nxyz,\n 123abc \n\rabc123"

我想用分隔符",", "\n", "\r", "\s"分割这个字符串以获得输出

['121', '1238', 'xyz', '123abc', 'abc123']

无论我尝试什么，分隔符都被接受为单个字符，而不是字符的组合。例如：

re.split("\n|,|\s|\r", x)

给出输出

['121', '', '1238', '', 'xyz', '', '', '123abc', '', '', 'abc123']

re.split("\n\s|,|\s|\r", x)

给出输出

['121', '', '1238', '', 'xyz', '', '123abc', '', 'abc123']

第二项比第一项略有改进。但如果这是必需的，我需要手动提供所有可能的组合。

类似的东西(有更多的组合)：

re.split("\n\s|\s\n|\s\n\s|\n|,\s|\s,|\s,\s|,|\s|\r", x)

产出：

['121', '1238', 'xyz', '', '123abc', '', 'abc123']

有什么更好的方法吗？

python

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-09-14 14:11:23

结合@Johnny Mopp和@alfinkel24的评论：

re.split("[\s,]+",  x)

将按需要将字符串拆分为

['121', '1238', 'xyz', '123abc', 'abc123']

解释：

[...]以前的characters.
\s中的任何一个或多个重复，任何空格字符，包括"\n, \r, \t"

正式文件：

\s

对于Unicode (str)模式:匹配Unicode空白字符(其中包括\t\n\r\f\v，以及许多其他字符，例如，许多语言中的排版规则规定的非中断空间)。如果使用ASCII标志，则只匹配\t\n\r\f\v。

对于8位(字节)模式:匹配ASCII字符集中视为空白的字符；这相当于\t\n\r\f\v.

票数 3

Stack Overflow用户

发布于 2021-09-14 13:53:24

允许re.split将任何分隔字符的1次或多次重复作为分隔符：

>>> re.split("[,\s]+", x)
['121', '1238', 'xyz', '123abc', 'abc123']

(“*”、“+”和“？”限定符都是贪婪的，它们尽可能地匹配。)

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69178811

复制

相似问题

问python通过多个分隔符和/或多个分隔符的组合拆分字符串
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问python通过多个分隔符和/或多个分隔符的组合拆分字符串EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问python通过多个分隔符和/或多个分隔符的组合拆分字符串
EN