首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >将运行索引添加到按用户id分区的pandas中

将运行索引添加到按用户id分区的pandas中
EN

Stack Overflow用户
提问于 2020-12-16 06:25:56
回答 1查看 38关注 0票数 0

给定此数据集

代码语言:javascript
复制
CUSTOMER_ID,ORDER_AT
A,2020-11-11 23:30:13
A,2020-11-11 23:32:53
A,2020-11-11 23:34:44
A,2020-11-11 23:35:55
B,2020-11-11 23:37:54
B,2020-11-11 23:39:23
C,2020-11-09 23:59:46
C,2020-11-10 0:03:04
C,2020-11-10 0:05:35
C,2020-11-10 0:19:40
C,2020-11-11 2:48:17
C,2020-11-11 2:49:06
C,2020-11-11 2:50:39
C,2020-11-11 2:51:57
D,2020-11-14 1:12:52
D,2020-11-14 1:13:14
D,2020-11-14 16:56:18

如何创建由CUSTOMER_ID分区的事务id的正在运行的二级索引?

我想要的输出是

代码语言:javascript
复制
CUSTOMER_ID,CUSTOMER_TRANSACTION_ID,ORDER_AT
A,0,2020-11-11 23:30:13
A,1,2020-11-11 23:32:53
A,2,2020-11-11 23:34:44
A,3,2020-11-11 23:35:55
B,0,2020-11-11 23:37:54
B,1,2020-11-11 23:39:23
C,0,2020-11-09 23:59:46
C,1,2020-11-10 0:03:04
C,2,2020-11-10 0:05:35
C,3,2020-11-10 0:19:40
C,4,2020-11-11 2:48:17
C,5,2020-11-11 2:49:06
C,6,2020-11-11 2:50:39
C,7,2020-11-11 2:51:57
D,0,2020-11-14 1:12:52
D,1,2020-11-14 1:13:14
D,2,2020-11-14 16:56:18
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-12-16 06:34:02

试试Groupbycumcount()

代码语言:javascript
复制
df['CUSTOMER_TRANSACTION_ID']=df.groupby('CUSTOMER_ID').cumcount()
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65314579

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档