首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用正则表达式或python中的split提取列的一部分

使用正则表达式或python中的split提取列的一部分
EN

Stack Overflow用户
提问于 2020-05-10 22:30:01
回答 1查看 18关注 0票数 0

你好,我有一个df,比如

代码语言:javascript
复制
COL1   COL2
G1     QANH010008.1:18255-18820(-):Hab_ob
G1     QANH010002:7-10(-):Hab_ob

我想创建2个新的COL3COL4,我将数字放在第一个-之前和第一个-之后

这里的结果应该是

代码语言:javascript
复制
COL1   COL2                                COL3   COL4
G1     QANH010008.1:18255-18820(+):Hab_ob  18255  18820
G1     QANH010002:7-10(-):Hab_ob           7      10 
EN

回答 1

Stack Overflow用户

发布于 2020-05-10 22:37:27

您可以为此使用命名捕获组,然后加入到原始DataFrame。这个答案包含了来自@MarkWang的几个建议。

代码语言:javascript
复制
df.join(df['COL2'].str.extract(r'(?P<COL3>\d+)\-(?P<COL4>\d+)')) 

输出:

代码语言:javascript
复制
Out[206]: 
  COL1                                COL2   COL3   COL4
0   G1  QANH010008.1:18255-18820(-):Hab_ob  18255  18820
1   G1           QANH010002:7-10(-):Hab_ob      7     10
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/61713666

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档