我有一些格式的原始电子表格数据,如:
12/7/2016 3:07:00, 88.05,
12/7/2016 3:08:00, 89.10,
12/7/2016 3:13:00, 87.00,
etc这些数据点不是在一个固定的间隔内取样,而是在一天中随机收集。
使用Google,我可以轻松地将其绘制到时间图表上。这使数值在时间线上的正确位置,并考虑到不均匀的抽样间隔。
我想生成时间线数据的直方图,同时考虑到时间戳,并计算一个时间框架内的平均值。我相信,如果我简单地通过内置的直方图图表来运行,或者选择我的数据值并通过一个平均值函数来运行,它将被不均匀的采样间隔所扭曲。
用什么最简单的方法来量化采样间隔(最好在Google内)来生成我的直方图和平均值?
或
是否有一种内建的方法,在考虑时间戳数据的同时,生成直方图/值平均,从而消除了量化数据的需要?
发布于 2016-12-10 18:26:24
您可以按以下方式计算适当的平均值(假设数据在A2:B50范围内)
=sum(arrayformula((A3:A50-A2:A49)*(B3:B50+B2:B49)/2))/(A50-A2)这个公式实现了梯形规则:分配给每个时间间隔的值是在该间隔结束时观察到的值的平均值。
没有一个内置的“加权直方图”工具,因此它似乎需要重新抽样来创建一个有代表性的直方图。这里有一种重新采样的方法。假设您需要20个样本,然后在C2中输入
=arrayformula(A2+(row(1:20)-1)*(A50-A2)/19)得到20个均匀分布的时间值。(除以19,是由于栅栏-柱的区别。)然后在D2,
=arrayformula(vlookup(C2:C21, A2:B50, 2))将查找每个样本时间的值。然后可以从D列构建直方图。
https://stackoverflow.com/questions/41078409
复制相似问题