我不太清楚这是一个矮胖的错误,熊猫的错误,还是我的用户错误。谁能提供澄清..。我的工作是使用字符串来完成唯一的操作,但是我经常遇到这些problems...and会很有价值的工作实践(比如总是设置UTC?)
所以我希望能返回一个天真的约会时间,而不是把它解释成本地的.
import pandas as pd
d=pd.DataFrame({'a':['2014-10-12','2014-10-11']})
d['b']=pd.to_datetime(d.a)
print d
print d['b'].unique()
print d['b'].max()
print d['b'].values.max()
a b
0 2014-10-12 2014-10-12
1 2014-10-11 2014-10-11
['2014-10-12T02:00:00.000000000+0200' '2014-10-11T02:00:00.000000000+0200'] #unique
2014-10-12 00:00:00 # pandas max
2014-10-12T02:00:00.000000000+0200 #numpy max小熊“1.9.2‘熊猫'0.16.1’
发布于 2015-05-22 15:46:41
它们都是相同的日期/时间,但函数返回的类型不同,具有不同的字符串表示(即不同的__str__和__repr__输出)。
d['b'].unique()和d['b'].values.max()返回numpy.datetime64对象,而d['b'].max()返回pandas.Timestamp对象。numpy.datetime64在输出为字符串时使用系统的区域设置来设置时区,而pandas.Timestamp不使用。
如果将pandas.Timestamp转换为numpy.datetime64,您将看到它们是相同的值:
np.datetime64(d['b'].max().to_datetime()) == d['b'].values.max()https://stackoverflow.com/questions/30400529
复制相似问题