文章/答案/技术大牛

发布

社区首页 >问答首页 >使用正则表达式将列拆分为多个

问使用正则表达式将列拆分为多个
EN

Stack Overflow用户

提问于 2022-03-23 14:13:11

回答 2查看 165关注 0票数 1

我有下表

df = pd.DataFrame({'favs':{0:'chicken_panfry1_t360_ketchup',
                          1:'chicken_bake2_t450_out_bbq',
                          2:'chicken_boiled2_season_gravy'}})

看上去像这样

   favs
0 chicken_panfry1_t360_ketchup
1 chicken_bake2_t450_out_bbq
2 chicken_boiled2_season_gravy

我想在最后一个下划线处分割列，创建两个新列，如下所示。

 favs                              recipe                     sauce
0 chicken_panfry1_t360_ketchup     chicken_panfry1_t360       ketchup
1 chicken_bake2_t450_out_bbq       chicken_bake2_t450_out     bbq
2 chicken_boiled2_season_gravy     chicken_boiled2_season     gravy

这就是我试过的

df[['recipe','sauce']]=df['favs'].str.split(r'.*_', expand=True)

这将正确地创建沙司列，但菜谱列为空白。它看起来像这样。不知道怎么改正。

 favs                              recipe       sauce
0 chicken_panfry1_t360_ketchup                  ketchup
1 chicken_bake2_t450_out_bbq                    bbq
2 chicken_boiled2_season_gravy                  gravy

dataframe

python

regex

pandas

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-03-23 14:15:27

您需要具有Series.str.extract正则表达式模式的(.*)_(.*)：

df[['recipe','sauce']]=df['favs'].str.extract(r'(.*)_(.*)', expand=True)

见regex演示。

(.*)_(.*)正则表达式将最后一个_之前的部分匹配并捕获到第1组(使用第一个(.*))，将最后一个_之后的部分匹配到第二个列中(使用第二个(.*))。

票数 2

Stack Overflow用户

发布于 2022-03-23 14:16:31

不需要正则表达式，您可以简单地将rsplit限制为1拆分：

df[['recipe','sauce']] = df['favs'].str.rsplit('_', n=1, expand=True)

产出：

                           favs                  recipe    sauce
0  chicken_panfry1_t360_ketchup    chicken_panfry1_t360  ketchup
1    chicken_bake2_t450_out_bbq  chicken_bake2_t450_out      bbq
2  chicken_boiled2_season_gravy  chicken_boiled2_season    gravy

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71588724

复制

相似问题

问使用正则表达式将列拆分为多个
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用正则表达式将列拆分为多个EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用正则表达式将列拆分为多个
EN