文章/答案/技术大牛

发布

社区首页 >问答首页 >大熊猫数据帧中的回收箱使用

问大熊猫数据帧中的回收箱使用
EN

Stack Overflow用户

提问于 2018-10-26 07:41:46

回答 1查看 142关注 0票数 0

我正在处理一个数据框架，它总共有4列，我想迭代地将该数据框架的每一列放入8个等份中。应为每一列的单独列中的数据分配bin号。即使为任何不同的数据框架提供了不同的列名，代码也应该工作。这是我试过的密码。

for c in df3.columns:
    df3['bucket_' + c] = (df3.max() - df3.min()) // 2 + 1
    buckets = pd.cut(df3['bucket_' + c], 8, labels=False)

样本数据帧

预期产出

受尊敬的bin列根据每个数据点的下降范围(使用pd.cut将列切割成8个等份)显示分配给每个数据点的bin号。提前谢谢！！

样本数据

gp1_min gp2 gp3 gp4

17.39   23.19   28.99   44.93

0.74    1.12    3.35    39.78

12.63   13.16   13.68   15.26

72.76   73.92   75.42   94.35

77.09   84.14   74.89   89.87

73.24   75.72   77.28   92.3

78.63   84.35   64.89   89.31

65.59   65.95   66.49   92.43

76.79   83.93   75.89   89.73

57.78   57.78   2.22    71.11

99.9    99.1    100      100

100     100    40.963855    100

预期产出

gp1_min gp2 gp3 gp4 bin_gp1 bin_gp2 bin_gp3 bin_gp4

17.39   23.19   28.99   44.93   2   2   2   3

0.74    1.12    3.35    39.78   1   1   1   3

12.63   13.16   13.68   15.26   1   2   2   2

72.76   73.92   75.42   94.35   5   6   6   7

77.09   84.14   74.89   89.87   6   7   6   7

73.24   75.72   77.28   92.3    6   6   6   7

78.63   84.35   64.89   89.31   6   7   5   7

65.59   65.95   66.49   92.43   5   6   5   7

76.79   83.93   75.89   89.73   6   7   6   7

57.78   57.78   2.22    71.11   4   4   1   6

99.9    99.1    100      100    8   8   8   8

100      100    40.96    100    8   8   3   8

python

pandas

dataframe

data-science

data-cleaning

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-10-26 08:05:58

我将使用numpy中的几个函数，即np.linspace创建bin边界，np.digitize将dataframe的值放入回收箱中：

import numpy as np
def binner(df,num_bins):
    for c in df.columns:
        cbins = np.linspace(min(df[c]),max(df[c]),num_bins+1)
        df[c + '_binned'] = np.digitize(df[c],cbins)
    return df

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/53003801

复制

相似问题

问大熊猫数据帧中的回收箱使用
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大熊猫数据帧中的回收箱使用EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大熊猫数据帧中的回收箱使用
EN