首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >时间事件密度

时间事件密度
EN

Stack Overflow用户
提问于 2015-01-06 18:56:04
回答 2查看 516关注 0票数 1

我正在做一项任务,我应该计算事件的密度。假设某个事件在几秒钟内发生了5次,这意味着它将具有比在几小时内发生5次的密度更高的密度。

我掌握着事件发生的时间。

我首先考虑的是计算每两个连续事件之间经过的时间,然后处理这些值的平均值和平均值。

我的问题是,我不知道如何通过数学准确地表示这个密度概念。假设我有5个事件发生在彼此非常接近的地方,然后是一个长时间的休息,然后又有5个事件发生在彼此非常接近的地方。我希望能够将其表示为高密度。我该怎么做呢?

在最后一个例子中,我知道我的均值不是真正的代表性,但我的标准差将表明这一点。然而,我怎么可能有一个单一的密度值(假设在0和1之间),我可以用它对不同的事件进行排名?

谢谢你的帮助!

EN

回答 2

Stack Overflow用户

发布于 2015-01-06 21:22:54

我会尝试harmonic mean,它代表你的事件发生的速率,仍然给你一个平均时间值。它的定义如下:

我认为它的行为接近于你的预期,因为它衡量的是你想要的东西,但不是在0和1之间,并且具有相反的趋势(小值意味着密集,大值意味着稀疏)。让我们来看看你的几个例子:

一小时内

  1. ~5个事件。为了简单起见,让我们假设每个事件之间有10分钟。然后我们在10分钟内有H = 6 /(6 * 1/10) = 10
  2. ~5事件,然后直到一小时结束(50分钟)才有事件发生。假设所有短时间间隔为2.5分钟,然后在10分钟内发生H = 6 / (5/2.5 + 1/50) = 6 * 50 / 101 = 2.97
  3. ~5事件,但此周期每半小时重新启动一次,因此我们将20分钟作为最后一个时间间隔,而不是50分钟。然后我们得到H = 6 / (5/2.5 + 1/20) = 6 * 20 / 41 = 2.92

正如你所看到的,集合中较长和较稀有的值的影响被我们使用反转的事实所减弱,因此对“在两次突发之间”行为的权重较小。你还可以比较具有相同“突发密度”但不以相同频率发生的行为,你将得到接近的数字,但其排序仍然反映了这种差异。

票数 1
EN

Stack Overflow用户

发布于 2015-01-06 20:35:08

为了让密度变得有意义,你需要定义两件事:

  • 您查看的范围,
  • 和time

的单位

在此之后,您可以说,例如,从12:00到12:10,事件的密度平均为10/分钟。

在您的情况下,什么是有意义的显然取决于您的输入数据是什么。如果您的测量持续1小时,并且您有数百万个条目,那么秒或毫秒可能是更好的单位选择。如果你测量一周并且有几个条目,那么一天是一个更好的单位。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/27797158

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档