文章/答案/技术大牛

发布

社区首页 >问答首页 >如何通过返回“new_col”的值来创建一个新列( "colA“)，如果"colA”可以在"colB“中找到

问如何通过返回“new_col”的值来创建一个新列( "colA“)，如果"colA”可以在"colB“中找到
EN

Stack Overflow用户

提问于 2022-06-03 19:33:09

回答 1查看 37关注 0票数 0

我被困在一个项目上。我试图通过检查两个列(A & B)来创建一个新的唯一列，如果A中的值在B中的任何位置存在，或者B的值存在于A中的任何位置，则返回该值，否则返回一个"“。例如，我有；

    colA colB
0    x     
1    y     
2         c
3         d
4         x
5    d     
6

在第一次比较colA和colB之后，我期待这样的事情发生；

  colA colB new_colA
0    x             x
1    y             y
2         c         
3         d        d
4         x        x
5    d             d
6

第二次；

  colA colB new_colA new_colB
0    x             x         
1    y             y         
2         c                 c
3         d        d         
4         x        x         
5    d             d         
6

我不知道如何使用python来实现它。我尝试了excel，我只是使用条件格式来突出显示重复的内容。

python

pandas

dataframe

jupyter-notebook

calculated-columns

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-06-03 20:07:24

如果空单元格中有can，则可以使用：

m = df['colB'].isin(df['colA'])
df['new_colA'] = df['colB'].where(m).fillna(df['colA'])
df['new_colB'] = df['colB'].mask(m)

输出：

  colA colB new_colA new_colB
0    x  NaN        x      NaN
1    y  NaN        y      NaN
2  NaN    c      NaN        c
3  NaN    d        d      NaN
4  NaN    x        x      NaN
5    d  NaN        d      NaN
6  NaN  NaN      NaN      NaN

空字符串的变体：

m = df['colB'].isin(df['colA'])&df['colB'].ne('')
df['new_colA'] = df['colB'].where(m).fillna(df['colA'])
df['new_colB'] = df['colB'].mask(m).fillna('')

输出：

  colA colB new_colA new_colB
0    x             x         
1    y             y         
2         c                 c
3         d        d         
4         x        x         
5    d             d         
6

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/72494396

复制

相似问题

问如何通过返回“new_col”的值来创建一个新列( "colA“)，如果"colA”可以在"colB“中找到
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何通过返回“new_col”的值来创建一个新列( "colA“)，如果"colA”可以在"colB“中找到EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何通过返回“new_col”的值来创建一个新列( "colA“)，如果"colA”可以在"colB“中找到
EN