我有一个由以下代码生成的dataframe:
time_index = pd.date_range(start=datetime(2013, 1, 1, 3),
end=datetime(2013, 1, 2, 2, 59),
freq='5T')
grid_columns = [u'in_brd', u'in_alt', u'out_brd', u'out_alt']
grid_proto = pd.DataFrame(index=time_index, columns=grid_columns)我还添加了一些数据到这个数据中。
当我试图在基本数据中的int偏移量索引中导航时,我得到了所有正确的信息:
In[152]: grid_proto.index[0] + 1
Out[152]: Timestamp('2013-01-01 03:05:00', tz=None)但是,如果我试图使用某种切片,我会得到一个错误:
In[153]: z = grid_proto[pd.notnull(x.in_brd)]
In[154]: z.index[0] + 1
Traceback (most recent call last):
File "<ipython-input-151-3ce8a4e5e2d6>", line 1, in <module>
z.index[0] + 1
File "tslib.pyx", line 664, in pandas.tslib._Timestamp.__add__ (pandas\tslib.c:12372)
ValueError: Cannot add integral value to Timestamp without offset.我理解这是因为在最初的情况下,我使用的是指向DatetimeIndex元素的链接,而不是标量。在第二种情况下,我得到了第一个索引元素的标量Timestamp值。我说的对吗?
如何正确处理这个偏移量?(我需要在这样的切片中导航)
发布于 2014-04-28 11:50:55
原因是,在第一种情况下,您有一个频率为5分钟的常规DatetimeIndex。因此,整数1将被解释为频率的一个单位(5分钟)。
在第二种情况下,由于切片的原因,您不再有常规的时刻表,而且DatetimeIndex不再有频率了(z.index.freq不会给出任何时间序列,而grid_proto.index.freq会给出5分钟)。
要解决这个问题,您可以简单地添加5分钟:
In [22]: import datetime as dt
In [23]: z.index[0] + dt.timedelta(minutes=5)
Out[23]: Timestamp('2013-01-01 03:05:00', tz=None)或者您也可以添加pd.DateOffset(minutes=5) (这将给出相同的结果)。
https://stackoverflow.com/questions/23339993
复制相似问题