首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >熊猫datetime64列的中值

熊猫datetime64列的中值
EN

Stack Overflow用户
提问于 2017-05-10 10:17:13
回答 3查看 9.1K关注 0票数 12

是否有方法以日期时间格式计算和返回日期时间列的中值?我想以datetime64ns格式计算python中列的中值。下面是列的示例:

代码语言:javascript
复制
df['date'].head()

0   2017-05-08 13:25:13.342
1   2017-05-08 16:37:45.545
2   2017-01-12 11:08:04.021
3   2016-12-01 09:06:29.912
4   2016-06-08 03:16:40.422

名称: recency,dtype: datetime64ns

我的目标是使中值与上面的日期列相同的日期时间格式:

尝试转换为np.array:

代码语言:javascript
复制
median_ = np.median(np.array(df['date']))

但这会导致错误:

代码语言:javascript
复制
TypeError: ufunc add cannot use operands with types dtype('<M8[ns]') and dtype('<M8[ns]')

转换为int64,然后计算中位数并尝试将返回格式转换为日期时间不起作用。

代码语言:javascript
复制
df['date'].astype('int64').median().astype('datetime64[ns]')
EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2017-05-10 10:20:49

取中间值怎么样?

代码语言:javascript
复制
dates = list(df.sort('date')['date'])
print dates[len(dates)//2]

如果对表进行排序,甚至可以跳过一行。

票数 6
EN

Stack Overflow用户

发布于 2018-02-09 16:06:10

您也可以尝试quantile(0.5)

代码语言:javascript
复制
df['date'].astype('datetime64[ns]').quantile(0.5, interpolation="midpoint")
票数 13
EN

Stack Overflow用户

发布于 2017-05-10 11:16:32

您已经接近了,median()返回一个float,因此首先将其转换为一个int

代码语言:javascript
复制
import math

median = math.floor(df['date'].astype('int64').median())

然后将表示日期的int转换为datetime64

代码语言:javascript
复制
result = np.datetime64(median, "ns") #unit: nanosecond
票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/43889611

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档