问基于第一列的时间对列中的连续变量进行入库
EN

Stack Overflow用户

提问于 2021-10-24 14:43:23

回答 1查看 24关注 0票数 0

我正在尝试使用python将列中的值绑定为1-5，6-10等5行的平均值。我的df数据集如下所示：

Unnamed: 0   C00_zscore  C01_zscore  C02_zscore
1   3   5   6
2   4   36  65
3   56  98  62
4   89  52  35
5   32  74  30
6   55  22  35
7   68  23  31
8   97  65  15
9   2   68  1
10  13  54  300
11

理想情况下，结果应该如下所示：

bin C00_binned  C01_binned  C02_binned
1   36.8        53            39.6
2   47          46.4          76.4

python

回答 1

Stack Overflow用户

发布于 2021-10-24 15:28:58

获取索引并将其除以bin大小。这将是行的存储箱。在您的示例中，行号从1开始，并且您需要大小为5的存储箱。

bin_num = row_num / (bin_size + 1)

现在每一行都有一个bin_num，按它分组，然后进行计算。

df['bin_num'] = df['Unnamed'] / 6
df.groupby(['bin_num']).mean()

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69697824

复制

相似问题

问基于第一列的时间对列中的连续变量进行入库
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于第一列的时间对列中的连续变量进行入库EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于第一列的时间对列中的连续变量进行入库
EN