我正试图将我的头脑集中在这项任务上,并想知道是否有一种标准的方法来完成这项工作,或者是否有一些有用的库。
某些事件在多个数据源S1上被跟踪和计时...序列号。记录的信息是事件类型和时间戳。可能有几个相同类型的事件顺序发生,也可能是间歇性的。可能存在“丢失”事件-即当一个源丢失它时,反之亦然,当一个源引入“假阳性”时。在不同震源对同一事件的观测之间通常存在时间差。由于源的物理位置,该时间差具有恒定分量,但也可以具有由网络延迟和其他因素引入的变化分量。
我需要找到一种算法,该算法可以找到最优的最大时间间隔,该时间间隔应该用于将所有来源的观察值分组到单个“观察到的事件”中,并允许检测丢失的事件和误报。
我想知道解决方案是否真的是在统计领域的某个地方,而不是算法。任何意见都将非常感谢。
发布于 2010-12-01 02:17:34
听起来你正在构建一个考勤系统:-)在我目前正在构建的系统中,这种分组观察也是必要的。在我的例子中,有些员工有通行证,他们会把通行证放在乘客面前,以记录他们的出勤情况。首先,系统将选择同一员工的所有考勤。然后,它将把它们放在一天一箱的盒子里,按注册时间排序。每一次注册都将根据它是开始还是停止进行评估。如果第一次注册是开始注册,则系统将在最多12小时后搜索停止注册。如果止损没有出现,则插入止损。当计划已知时,可以将额外的智能放在适当的位置。也许你可以使用统计数据,但在我的案例中,这是一个算法问题,结合了组织的知识。
https://stackoverflow.com/questions/3688392
复制相似问题