首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用正则表达式将列拆分为多个

使用正则表达式将列拆分为多个
EN

Stack Overflow用户
提问于 2022-03-23 14:13:11
回答 2查看 165关注 0票数 1

我有下表

代码语言:javascript
复制
df = pd.DataFrame({'favs':{0:'chicken_panfry1_t360_ketchup',
                          1:'chicken_bake2_t450_out_bbq',
                          2:'chicken_boiled2_season_gravy'}})

看上去像这样

代码语言:javascript
复制
   favs
0 chicken_panfry1_t360_ketchup
1 chicken_bake2_t450_out_bbq
2 chicken_boiled2_season_gravy

我想在最后一个下划线处分割列,创建两个新列,如下所示。

代码语言:javascript
复制
 favs                              recipe                     sauce
0 chicken_panfry1_t360_ketchup     chicken_panfry1_t360       ketchup
1 chicken_bake2_t450_out_bbq       chicken_bake2_t450_out     bbq
2 chicken_boiled2_season_gravy     chicken_boiled2_season     gravy

这就是我试过的

代码语言:javascript
复制
df[['recipe','sauce']]=df['favs'].str.split(r'.*_', expand=True)

这将正确地创建沙司列,但菜谱列为空白。它看起来像这样。不知道怎么改正。

代码语言:javascript
复制
 favs                              recipe       sauce
0 chicken_panfry1_t360_ketchup                  ketchup
1 chicken_bake2_t450_out_bbq                    bbq
2 chicken_boiled2_season_gravy                  gravy
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-03-23 14:15:27

您需要具有Series.str.extract正则表达式模式的(.*)_(.*)

代码语言:javascript
复制
df[['recipe','sauce']]=df['favs'].str.extract(r'(.*)_(.*)', expand=True)

regex演示

(.*)_(.*)正则表达式将最后一个_之前的部分匹配并捕获到第1组(使用第一个(.*)),将最后一个_之后的部分匹配到第二个列中(使用第二个(.*))。

票数 2
EN

Stack Overflow用户

发布于 2022-03-23 14:16:31

不需要正则表达式,您可以简单地将rsplit限制为1拆分:

代码语言:javascript
复制
df[['recipe','sauce']] = df['favs'].str.rsplit('_', n=1, expand=True)

产出:

代码语言:javascript
复制
                           favs                  recipe    sauce
0  chicken_panfry1_t360_ketchup    chicken_panfry1_t360  ketchup
1    chicken_bake2_t450_out_bbq  chicken_bake2_t450_out      bbq
2  chicken_boiled2_season_gravy  chicken_boiled2_season    gravy
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71588724

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档