首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >三年后的Pandas Dataframe

三年后的Pandas Dataframe
EN

Stack Overflow用户
提问于 2017-02-07 05:01:36
回答 1查看 394关注 0票数 0

我希望利用我的数据集的最后三年(最后三年)。我将year、month和quarter列合并到一个名为'date‘的列中,这是一个datetime函数。我想使用他的“日期”列,以便根据我运行报告的时间来获取最近3年的数据。

我想过使用.tail,但我的问题是行数会发生变化,因此希望根据日期列进行过滤。

在下面的代码中,您将看到我是基于年份进行过滤的,但实际上,我需要更精确地按3年进行过滤-例如,如果我在从现在开始的2个月内运行报告,它将使我精确地返回3年。

代码语言:javascript
复制
df1= df.loc[df['YEAR'].isin(['2014','2015','2016'])]
monthend = {'Q1':'3/31','Q2':'6/30','Q3':'9/30','Q4':'12/31'}
df1['Date']=df1['QUARTER'].map(monthend)+'/'+ df1['YEAR']
df1['Date'] = pd.to_datetime(df1['Date'])

Dataframe看起来像这样:

代码语言:javascript
复制
YEAR    MONTH   QUARTER  Fruit Sales ($)    Date
2014      2       1         12           3/31/2014
2014      4       2         12           6/30/2014
2014      9       3         13           9/30/2014
2014      12      4         11           12/31/2014
2015      1       1         3            3/31/2015
2015      4       2         54           6/30/2015
2015      8       3         11           9/30/2015
2015      11      4         43           12/31/2015
2016      3       1         54           3/31/2016
2016      5       2         34           6/30/2016
2016      7       3         6            9/30/2016
2016      10      4         7            12/31/2016
2017      1       1         57           3/31/2017

有什么想法吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-02-07 05:43:53

我认为我们可以将(当前时间-3年)保存为变量,然后用该变量过滤DataFrame。

所以

代码语言:javascript
复制
import time
then = datetime.datetime.now() - datetime.timedelta(days=3*365)
then = pd.to_datetime(then)

现在回到我们的数据帧

代码语言:javascript
复制
df2 = df1[(df1['Date'] > then)]

我相信有一个更优雅的解决方案,但我认为这可以完成工作!

以下是我使用的源码:

pandas apply filter for boolean type

filtering pandas dataframes on dates

Subtract an year from a datetime column in pandas

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42077190

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档