首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫栏随时间的不同

熊猫栏随时间的不同
EN

Stack Overflow用户
提问于 2020-06-08 03:52:44
回答 2查看 67关注 0票数 2

**底部编辑**

我有一个库存数据的数据框架,如下所示:

代码语言:javascript
复制
d = {'product': [a, b, a, b, c], 'amount': [1, 2, 3, 5, 2], 'date': [2020-6-6, 2020-6-6, 2020-6-7, 
2020-6-7, 2020-6-7]}
df = pd.DataFrame(data=d)
df
 product  amount  date
0     a     1      2020-6-6
1     b     2      2020-6-6
2     a     3      2020-6-7
3     b     5      2020-6-7
4     c     2      2020-6-7

我想知道每月的存货差额是多少。输出将如下所示:

代码语言:javascript
复制
df
 product   diff   isnew  date
0     a     nan   nan   2020-6-6
1     b     nan   nan   2020-6-6
2     a     2     False 2020-6-7
3     b     3     False 2020-6-7
4     c     2     True  2020-6-7

不好意思,如果我在第一个例子中不清楚,实际上我有很多个月的数据,所以我不只是在做一个周期与另一个阶段的区别。它需要是一个一般的情况,它查看月份n对n-1,然后n-1和n-2的差值,等等。

在潘达斯做这件事最好的方法是什么?

EN

回答 2

Stack Overflow用户

发布于 2020-06-08 04:11:15

您可以在列产品上尝试groupby,并为列'diff‘设置diff列数量。然后对列'isnew‘使用duplicated

代码语言:javascript
复制
df['diff'] = df.groupby('product')['amount'].diff()
df['isnew'] = ~df['product'].duplicated()
print (df)
  product  amount      date  diff  isnew
0       a       1  2020-6-6   NaN   True
1       b       2  2020-6-6   NaN   True
2       a       3  2020-6-7   2.0  False
3       b       5  2020-6-7   3.0  False
4       c       2  2020-6-7   NaN   True
票数 2
EN

Stack Overflow用户

发布于 2020-06-08 04:16:36

我想这里的关键是找到isnew

代码语言:javascript
复制
# new products by `product`
new_prods = df['date'] != df.date.min()
duplicated = df.duplicated('product')

# first appearance of new products
# or duplicated *old* products
valids = new_prods ^ duplicated
df.loc[valids,'is_new'] = ~ duplicated

# then the difference:
df['diff'] = (df.groupby('product')['amount'].diff()           # normal differences
                  .fillna(df['amount'])         # fill the first value for all product
                  .where(df['is_new'].notna())  # remove the first month
             )

输出:

代码语言:javascript
复制
  product  amount      date is_new  diff
0       a       1  2020-6-6    NaN   NaN
1       b       2  2020-6-6    NaN   NaN
2       a       3  2020-6-7  False   2.0
3       b       5  2020-6-7  False   3.0
4       c       2  2020-6-7   True   2.0
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62254743

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档