首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如果另一列不包含pandas中的特定文本,则根据列删除重复项

如果另一列不包含pandas中的特定文本,则根据列删除重复项
EN

Stack Overflow用户
提问于 2020-03-03 05:54:16
回答 1查看 32关注 0票数 0

我想删除基于列id的重复项,如果它不包含国家1或国家2中的单词us,我该如何实现这一点。

代码语言:javascript
复制
ID  country1  country2    status 
1.   us,yt      au,in,sg     monetize
1.   tr,hk      ds,gh        block
2.    ju        te,yu,us     block
2.    ju        te,yu        block


Expected output 
ID  country1.  country2.    status 
1.   us,yt      au,in,sg     monetize
2.    ju        te,yu,us     block
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-03-03 05:57:43

尝试:

代码语言:javascript
复制
df["key"]=df["country1"].str.contains("us")| df["country2"].str.contains("us")
df=df.sort_values("key", ascending=False).drop_duplicates(subset="ID", keep="first").drop(columns=["key"])

输出:

代码语言:javascript
复制
   ID country1  country2    status
0  1.    us,yt  au,in,sg  monetize
2  2.       ju  te,yu,us     block
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60497220

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档