文章/答案/技术大牛

发布

社区首页 >问答首页 >解析日期并从.csv创建时间序列

问解析日期并从.csv创建时间序列
EN

Stack Overflow用户

提问于 2016-10-13 10:57:24

回答 1查看 961关注 0票数 2

我正在使用一个简单的csv文件，其中包含有关热量摄入的数据。它有4列：cal，day，month，year。看起来是这样的：

cal        month  year  day
3668.4333      1  2002   10
3652.2498      1  2002   11
3647.8662      1  2002   12
3646.6843      1  2002   13
...
3661.9414      2  2003   14

# data types
cal      float64
month      int64
year       int64
day        int64

我试着做一些简单的时间序列分析。因此，我希望将month、year和day解析为一列。我使用pandas尝试了以下操作

import pandas as pd
from pandas import Series, DataFrame, Panel

data = pd.read_csv('time_series_calories.csv', header=0, pars_dates=['day', 'month', 'year']], date_parser=True, infer_datetime_format=True)

我的问题是：(1)如何解析数据和(2)定义新列的数据类型？我知道还有很多类似的问题和答案(如here、here和here) --但到目前为止，我无法做到这一点。

python-3.x

csv

parsing

pandas

time-series

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-10-13 11:00:51

您可以使用参数parse_dates，其中在read_csv中的list中定义列名。

import pandas as pd
import numpy as np
import io

temp=u"""cal,month,year,day
3668.4333,1,2002,10
3652.2498,1,2002,11
3647.8662,1,2002,12
3646.6843,1,2002,13
3661.9414,2,2003,14"""
#after testing replace io.StringIO(temp) to filename
df = pd.read_csv(io.StringIO(temp), parse_dates=[['year','month','day']])

print (df)
  year_month_day        cal
0     2002-01-10  3668.4333
1     2002-01-11  3652.2498
2     2002-01-12  3647.8662
3     2002-01-13  3646.6843
4     2003-02-14  3661.9414

print (df.dtypes)
year_month_day    datetime64[ns]
cal                      float64
dtype: object

然后可以重命名列：

df.rename(columns={'year_month_day':'date'}, inplace=True)
print (df)
        date        cal
0 2002-01-10  3668.4333
1 2002-01-11  3652.2498
2 2002-01-12  3647.8662
3 2002-01-13  3646.6843
4 2003-02-14  3661.9414

或者更好的方法是将具有新列名的dictionary传递给parse_dates。

df = pd.read_csv(io.StringIO(temp), parse_dates={'dates': ['year','month','day']})

print (df)
       dates        cal
0 2002-01-10  3668.4333
1 2002-01-11  3652.2498
2 2002-01-12  3647.8662
3 2002-01-13  3646.6843
4 2003-02-14  3661.9414

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40019090

复制

相似问题

问解析日期并从.csv创建时间序列
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问解析日期并从.csv创建时间序列EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问解析日期并从.csv创建时间序列
EN