对于像DataFrame这样的样本,
>>> import pandas as pd
>>> index = pd.date_range(start='1/1/2018', periods=6, freq='15T')
>>> data = ['ON_PEAK', 'OFF_PEAK', 'ON_PEAK', 'ON_PEAK', 'OFF_PEAK', 'OFF_PEAK']
>>> df = pd.DataFrame(data, index=index, columns=['tou'])
>>> df
tou
2018-01-01 00:00:00 ON PEAK
2018-01-01 00:15:00 OFF PEAK
2018-01-01 00:30:00 ON PEAK
2018-01-01 00:45:00 ON PEAK
2018-01-01 01:00:00 OFF PEAK
2018-01-01 01:15:00 OFF PEAK如何获得tou值不是ON_PEAK但其前面的行为ON_PEAK的所有索引,即输出如下:
['2018-01-01 00:15:00', '2018-01-01 01:00:00']或者,如果使用ON_PEAK和它们旁边的第一行更容易获得所有行,即
['2018-01-01 00:00:00', '2018-01-01 00:15:00', '2018-01-01 00:30:00', '2018-01-01 00:45:00', '2018-01-01 01:00:00']发布于 2018-05-18 20:17:32
您需要找到tou不是ON_PEAK的行,使用pandas.shift()找到的前一个tou是ON_PEAK。注意,shift中的正值给出了以前的第n个值,负值给出了数据中的第n个值。
df.loc[(df['tou']!='ON_PEAK') & (df['tou'].shift(1)=='ON_PEAK')]输出:
tou
2018-01-01 00:15:00 OFF_PEAK
2018-01-01 01:00:00 OFF_PEAKhttps://stackoverflow.com/questions/50418561
复制相似问题