首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >基于第一列的时间对列中的连续变量进行入库

基于第一列的时间对列中的连续变量进行入库
EN

Stack Overflow用户
提问于 2021-10-24 14:43:23
回答 1查看 24关注 0票数 0

我正在尝试使用python将列中的值绑定为1-5,6-10等5行的平均值。我的df数据集如下所示:

代码语言:javascript
复制
Unnamed: 0   C00_zscore  C01_zscore  C02_zscore
1   3   5   6
2   4   36  65
3   56  98  62
4   89  52  35
5   32  74  30
6   55  22  35
7   68  23  31
8   97  65  15
9   2   68  1
10  13  54  300
11

理想情况下,结果应该如下所示:

代码语言:javascript
复制
bin C00_binned  C01_binned  C02_binned
1   36.8        53            39.6
2   47          46.4          76.4
EN

回答 1

Stack Overflow用户

发布于 2021-10-24 15:28:58

获取索引并将其除以bin大小。这将是行的存储箱。在您的示例中,行号从1开始,并且您需要大小为5的存储箱。

代码语言:javascript
复制
bin_num = row_num / (bin_size + 1)

现在每一行都有一个bin_num,按它分组,然后进行计算。

代码语言:javascript
复制
df['bin_num'] = df['Unnamed'] / 6
df.groupby(['bin_num']).mean()
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69697824

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档