首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >查找不同年份之间的销售差异

查找不同年份之间的销售差异
EN

Stack Overflow用户
提问于 2018-05-12 19:37:39
回答 1查看 43关注 0票数 1

我有一个分析销售的数据。我取得了一些进展,这是我做的最后一个部分,显示了每个商店每年(2016-2017-2018)的总销售额。

代码语言:javascript
复制
   Store_Key  Year  count   Total_Sales

0   5.0       2016  28      6150.0
1   5.0       2017  39      8350.0
2   5.0       2018  27      5150.0
3   7.0       2016  3664    105370.0
4   7.0       2017  3736    116334.0
5   7.0       2018  3863    99375.0
6   10.0      2016  3930    79904.0
7   10.0      2017  3981    91227.0
8   10.0      2018  4432    97226.0
9   11.0      2016  4084    91156.0
10  11.0      2017  4220    99565.0
11  11.0      2018  4735    113584.0
12  16.0      2016  4257    135655.0
13  16.0      2017  4422    144725.0
14  16.0      2018  4630    133820.0

我想看看每一家商店在不同年份之间的销售差异。所以我使用了数据透视表,并用一个不同的列来显示每年。

代码语言:javascript
复制
Store_Key   2016        2017        2018

    5.0     6150.0      8350.0      5150.0
    7.0     105370.0    116334.0    99375.0
    10.0    79904.0     91227.0     97226.0
    11.0    91156.0     99565.0     113584.0
    16.0    135655.0    144725.0    133820.0
    18.0    237809.0    245645.0    88167.0
    20.0    110225.0    131999.0    83302.0
    24.0    94087.0     101062.0    108888.0

如果商店是恒定的,当我使用列之间的差异时,我会很快找到不同之处,但不幸的是,每年都有如此多的新商店成立并关闭。

所以我的问题是:有没有办法通过展示新店和关闭门店来区分门店?

我可以找到具有NULL值的商店并将其分开,但我希望检查是否有更好的选择。

EN

回答 1

Stack Overflow用户

发布于 2018-05-12 20:14:49

要获得2017年和2016年的差异,您可以执行以下操作:

代码语言:javascript
复制
 df['evolution'] = df['2017'] - df['2016']

如果要删除至少有一个NaN值的行,可以像这样删除这些行:

代码语言:javascript
复制
df.dropna(axis=0, how='any', inplace=False)

如果你有0而不是NaN,你可以这样做:

代码语言:javascript
复制
import numpy as np
df.replace(0, np.nan)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50305796

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档