文章/答案/技术大牛

发布

社区首页 >问答首页 >在特殊情况下使用熊猫(python)将重复数据放到数据帧中

问在特殊情况下使用熊猫(python)将重复数据放到数据帧中
EN

Stack Overflow用户

提问于 2017-01-30 03:34:18

回答 1查看 644关注 0票数 0

我有以下数据框架：

我希望删除WD列中的重复数据，如果它们具有相同的drug_id。

例如，WD列中有两个“哭声”，其drug_id = 32。所以我想移除其中一个哭过的行。

我怎么能做到呢？我知道如何复制行，但不知道如何将此条件添加到此代码中。df = df.apply(lambda x:x.drop_duplicates())

python

pandas

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-01-30 03:38:16

您可以将drop_duplicates与subset参数一起使用，该参数可选择地将某些列视为重复项：

df.drop_duplicates(subset = ["drug_id", "WD"])

如果上/下情况对考虑重复很重要，您可以尝试：

df[~df[['drug_id', 'WD']].apply(lambda x: x.str.lower()).duplicated()]

在可以将drug_id列和WD列转换为小写的情况下，请使用duplicated()方法标识重复的行，然后使用生成的逻辑序列筛选出重复的行。

示例

df = pd.DataFrame({"A": [1,1,2,2], "B":[1,2,3,4], "C":[1,1,2,3]})

df
#   A   B   C
#0  1   1   1
#1  1   2   1
#2  2   3   2
#3  2   4   3

df.drop_duplicates(subset=['A', 'C'])
#   A   B   C
#0  1   1   1
#2  2   3   2
#3  2   4   3

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/41928667

复制

相似问题

问在特殊情况下使用熊猫(python)将重复数据放到数据帧中
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在特殊情况下使用熊猫(python)将重复数据放到数据帧中EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在特殊情况下使用熊猫(python)将重复数据放到数据帧中
EN