首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在pandas中创建百分位数存储桶

在pandas中创建百分位数存储桶
EN

Stack Overflow用户
提问于 2013-06-25 07:17:22
回答 1查看 10.7K关注 0票数 17

我正在尝试根据数据的值将数据分类到百分位桶中。我的数据看起来像是,

代码语言:javascript
复制
a = pnd.DataFrame(index = ['a','b','c','d','e','f','g','h','i','j'], columns=['data'])
a.data = np.random.randn(10)
print a
print '\nthese are ranked as shown'
print a.rank()

       data
a -0.310188
b -0.191582
c  0.860467
d -0.458017
e  0.858653
f -1.640166
g -1.969908
h  0.649781
i  0.218000
j  1.887577

these are ranked as shown
   data
a     4
b     5
c     9
d     3
e     8
f     2
g     1
h     7
i     6
j    10

为了对这些数据进行排名,我使用了rank函数。然而,我感兴趣的是创建一个前20%的桶。在上面显示的示例中,这是一个包含标签'c','j‘的列表

代码语言:javascript
复制
desired result : ['c','j']

如何获得想要的结果?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-06-25 07:55:58

代码语言:javascript
复制
In [13]: df[df > df.quantile(0.8)].dropna()
Out[13]: 
       data
c  0.860467
j  1.887577

In [14]: list(df[df > df.quantile(0.8)].dropna().index)
Out[14]: ['c', 'j']
票数 24
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17286672

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档