我在一家接收智能电表数据的公司工作。对于一个活动流,这些数据可能有2天的历史,如果出现错误(间隙等),则可能会填充post。目前,我们储存这个典型的5年。然后将数据拉到一个SSAS立方体中,并将其聚合为1分钟、5米、30米、1小时、1天、1周、1个月的总和。对于每一个这些聚合,Min,Max,Avg也被存储。构建这个多维数据集很慢,而且目前无法扩展,因为它是从单个源挖掘数据的。
我认为每个数据点使用RRD风格的数据库会更适合由数据推送驱动。不过,我对RRD有几个问题(欢迎举例)。
欢迎举一些例子。
发布于 2015-08-28 08:53:56
RRA是一种循环存档,定义了数据点的数量和分辨率.所以你可以-假设5分钟的抽样率:
RRA:AVERAGE:0.5:1:2000
RRA:AVERAGE:0.5:12:2400将举行大约一周的500万分辨率,100天的1小时分辨率。但你可以很容易地延长你的500万分辨率RRA --尽管它将使你的RRD更大。问题是-你真的需要吗?RRDs的全部要点是自动存档与图形化分辨率--查看一年的统计数据,而且您无论如何也不能渲染500万个分辨率。对于500万个样本,1600 is宽图至少只有6天。
rrdtool dump以XML形式提取RRD的内容,您也可以直接修改该内容,然后再对其进行rrdtool restore。如果您需要使用任何实际频率来执行此操作,我建议使用rrdtool以外的其他方法。https://stackoverflow.com/questions/32266919
复制相似问题