我希望利用我的数据集的最后三年(最后三年)。我将year、month和quarter列合并到一个名为'date‘的列中,这是一个datetime函数。我想使用他的“日期”列,以便根据我运行报告的时间来获取最近3年的数据。
我想过使用.tail,但我的问题是行数会发生变化,因此希望根据日期列进行过滤。
在下面的代码中,您将看到我是基于年份进行过滤的,但实际上,我需要更精确地按3年进行过滤-例如,如果我在从现在开始的2个月内运行报告,它将使我精确地返回3年。
df1= df.loc[df['YEAR'].isin(['2014','2015','2016'])]
monthend = {'Q1':'3/31','Q2':'6/30','Q3':'9/30','Q4':'12/31'}
df1['Date']=df1['QUARTER'].map(monthend)+'/'+ df1['YEAR']
df1['Date'] = pd.to_datetime(df1['Date'])Dataframe看起来像这样:
YEAR MONTH QUARTER Fruit Sales ($) Date
2014 2 1 12 3/31/2014
2014 4 2 12 6/30/2014
2014 9 3 13 9/30/2014
2014 12 4 11 12/31/2014
2015 1 1 3 3/31/2015
2015 4 2 54 6/30/2015
2015 8 3 11 9/30/2015
2015 11 4 43 12/31/2015
2016 3 1 54 3/31/2016
2016 5 2 34 6/30/2016
2016 7 3 6 9/30/2016
2016 10 4 7 12/31/2016
2017 1 1 57 3/31/2017有什么想法吗?
发布于 2017-02-07 05:43:53
我认为我们可以将(当前时间-3年)保存为变量,然后用该变量过滤DataFrame。
所以
import time
then = datetime.datetime.now() - datetime.timedelta(days=3*365)
then = pd.to_datetime(then)现在回到我们的数据帧
df2 = df1[(df1['Date'] > then)]我相信有一个更优雅的解决方案,但我认为这可以完成工作!
以下是我使用的源码:
pandas apply filter for boolean type
https://stackoverflow.com/questions/42077190
复制相似问题