首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用离群点切割连续数据

用离群点切割连续数据
EN

Stack Overflow用户
提问于 2022-07-07 07:44:54
回答 1查看 40关注 0票数 0

例如,我有DataFrame

代码语言:javascript
复制
df = pd.DataFrame({'a': [1, 2, 3, 4, 5, 6, 7, 8, 9], 'b': [2, 2, 4, 3, 1000, 2000, 1, 500, 3]})

我需要通过离群点得到这些间隔: 1-4,5-6,7,8,9。

用pd.cut和pd.qcut进行切割并不能给出这些结果。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-07-07 08:07:19

您可以根据上面/下面的掩码按连续值对它们进行分组:

代码语言:javascript
复制
m = df['b'].gt(100)
df['group'] = m.ne(m.shift()).cumsum()

产出:

代码语言:javascript
复制
   a     b  group
0  1     2      1
1  2     2      1
2  3     4      1
3  4     3      1
4  5  1000      2
5  6  2000      2
6  7     1      3
7  8   500      4
8  9     3      5
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72894040

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档