首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >整型/浮点型加权平均日期时间( DataFrame )

整型/浮点型加权平均日期时间( DataFrame )
EN

Stack Overflow用户
提问于 2016-11-11 02:26:25
回答 2查看 409关注 0票数 0

我正在尝试找出对datetime字段进行intfloat加权平均的方法。我正在考虑如何将datetime转换为int,然后算算,然后再转换回datetime。但不确定如何做到这一点。任何帮助都是非常感谢的。

我应该说得更清楚些。实际问题是要做这样的事情

代码语言:javascript
复制
>>> df1 = pd.DataFrame({'Date': {0: '2016-10-11', 1: '2016-10-11', 2: '2016-10-11', 3: '2016-10-11', 4: '2016-10-11',5: '2016-10-11'}, 'Qty': {0: 100, 1: 3232, 2: 4232, 3: 4322, 4: 666, 5: 98}, 'StartTime': {0: '08:00:00.241', 1: '08:00:00.243', 2: '12:34:23.563', 3: '08:14:05.908', 4: '18:54:50.100', 5: '10:08:36.657'},'Id':{0:'abc',1:'abc',2:'bcd',3:'bcd',4:'abc',5:'bcd'}})
>>> df1
         Date   Id   Qty     StartTime
0  2016-10-11  abc   100  08:00:00.241
1  2016-10-11  abc  3232  08:00:00.243
2  2016-10-11  bcd  4232  12:34:23.563
3  2016-10-11  bcd  4322  08:14:05.908
4  2016-10-11  abc   666  18:54:50.100
5  2016-10-11  bcd    98  10:08:36.657
>>> df1['StartTime'] = pd.to_datetime(df1['Date'] + ' ' + df1['StartTime'])
>>> df1['StartTime'][0]
Timestamp('2016-10-11 08:00:00.241000')

现在,我尝试按Id分组,并采用Qty加权StartTime。请注意,StartTime也有微秒组件。

即使StartTime列的每一项都为Timestamp,以下代码似乎也不起作用

代码语言:javascript
复制
>>> (df1.groupby['Id']).apply(lambda x:np.average(x['StartTime'], weights=x['Qty']))
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'instancemethod' object has no attribute '__getitem__'
EN

回答 2

Stack Overflow用户

发布于 2016-11-11 02:42:04

您可以使用total_seconds()为您提供一个整数,该整数可用于对多个datetime值求平均值。

代码语言:javascript
复制
def avg_date(lst):
    epoch = datetime.datetime(1900, 1, 1)
    seconds_per_day = 3600 * 24
    avg = sum((d - epoch).total_seconds() for d in lst) / len(lst)
    return epoch + datetime.timedelta(avg // seconds_per_day, avg % seconds_per_day)
票数 1
EN

Stack Overflow用户

发布于 2016-11-11 02:56:09

您可以使用时间戳

代码语言:javascript
复制
import datetime 
dt1 = datetime.datetime.now()
dt2 = datetime.datetime(1980, 1, 1)
timestamp1 = dt1.timestamp()
timestamp2 = dt2.timestamp()
timestamp_avg = (timestamp2+timestamp1)/2
dt_avg = datetime.datetime.fromtimestamp(timestamp_avg)
print(dt_avg)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/40534575

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档