首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >销售速度定义为销售/运行天数

销售速度定义为销售/运行天数
EN

Stack Overflow用户
提问于 2018-10-15 11:04:51
回答 1查看 28关注 0票数 0

我有一个交易销售数据:

代码语言:javascript
复制
print(df)

dt_op      quantity      cod_id
20/01/18      1            100
20/01/18      8            102

21/01/18      1            100 
21/01/18     10            102
...

我想为“days_elapsed_since_the_launch_of_that_product,”中的每个不同项定义一个新变量“”为"cumulative_sales /cod_id“。

我试过:

代码语言:javascript
复制
start = min(df["dt_op"])

df["running_days"] = (df["dt_op"] - start).astype('timedelta64[D]')
df["csum"] = df.quantity.cumsum()

df["speed"] = df["csum"] / df["running_days"]

但是它并不是为每一项计算;对于计算问题和缓慢的运行时间,我将避免for -循环。

EN

回答 1

Stack Overflow用户

发布于 2018-10-15 11:26:41

尝试在一个新列中为每一个“cod_id”保存第一个启动日期:

df2 = df.groupby(['cod_id']).dt_op.min()

并将其合并回您的数据

df = pd.merge(df, df2, on='cod_id', how='left')

然后创建一个新列,作为最小日期和第一个日期之间的数据差异。你可以像上面那样计算csum,然后再计算出日期差。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52815308

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档