首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pandas: drop_duplicates不能正常工作

Pandas: drop_duplicates不能正常工作
EN

Stack Overflow用户
提问于 2018-05-17 19:23:18
回答 2查看 186关注 0票数 0

对于以下系列,drop_duplicates无法正常工作:

代码语言:javascript
复制
8672.0
8672.0
8672.0
8672.0
8670.0
8670.0
8670.0
8670.0
8670.0
8670.0
8672.0
8672.0
8672.0
8672.0
8672.0
8672.0
8672.0
8672.0
8672.0
8672.0
8670.0
8670.0
8670.0
8670.0
8670.0

通过使用drop_duplicates(keep='first'),它应该返回4个值:

代码语言:javascript
复制
8672.0
8670.0
8672.0
8670.0

但实际上,它只返回前两个值:

代码语言:javascript
复制
8672.0
8670.0

它有什么问题,或者关于如何使用这个drop_duplicates来获得我想要的值有什么建议?非常感谢。

EN

回答 2

Stack Overflow用户

发布于 2018-05-17 19:25:19

DataFrame.drop_duplicates()会删除所有副本,而不仅仅是连续的副本。

假设s是一个系列:

代码语言:javascript
复制
In [93]: s[s.diff().ne(0)]
Out[93]:
0     8672.0
3     8670.0
9     8672.0
19    8670.0
Name: 8672.0, dtype: float64
票数 3
EN

Stack Overflow用户

发布于 2018-05-17 19:25:28

我认为需要第一个连续的值,所以解决方案是通过shifted值进行比较,并通过boolean indexing进行过滤

代码语言:javascript
复制
s1 = s[s.ne(s.shift())]
print (s1)
0     8672.0
4     8670.0
10    8672.0
20    8670.0
Name: col, dtype: float64
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50390206

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档