首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >减少/简化时间序列数据

减少/简化时间序列数据
EN

Stack Overflow用户
提问于 2012-05-25 06:21:47
回答 2查看 1.2K关注 0票数 3

我希望简化时间序列数据(减少点的数量,同时保持图形的形状不变)。例如,如果我有这个数据集:

代码语言:javascript
复制
Time: 1, Value: 5
Time: 6, Value: 5
Time: 11, Value: 5.1
Time: 12, Value: 5
Time: 20, Value: 5.2
Time: 22, Value: 6
Time: 23, Value: 10

容差为.5的简化版本如下所示:

代码语言:javascript
复制
Time: 1, Value: 5
Time: 20, Value: 5.2
Time: 22, Value: 6
Time: 23, Value: 10

我知道用于GIS数据的Douglas-Peucker算法,但我不确定如何将其应用于时间序列数据,因为轴具有不同的单位。如果我能在数据库中完成这一切,那就太棒了。

EN

回答 2

Stack Overflow用户

发布于 2012-05-25 09:23:21

我不知道有什么内置的函数可以做到这一点。下面的查询可能会完成以下工作:

代码语言:javascript
复制
WITH x AS (
    SELECT t, val
          ,@(lead(val) OVER w - val) AS delta1
          ,@(lag(val)  OVER w - val) AS delta2
    FROM   tbl
    WINDOW w AS (ORDER BY t)
    ORDER  BY t
    )
SELECT t, val
FROM   x
WHERE  delta1 > 0.2
   OR  delta2 > 0.2
   OR  delta1 IS NULL
   OR  delta2 IS NULL;

我在CTE中使用window functions lead() and lag()absolute value operator @来计算增量(应该是最快的)。

只有那些增量中至少有一个大于0.2 (与您的示例匹配的任意阈值)的行才会被保留。

第一行和最后一行是delta1delta2NULL的特殊情况(没有前导/滞后行)。我们希望在任何情况下都包含这些行,因此我在最终的SELECT中添加了空检查。

生成您请求的结果。

另一种变体专注于方向变化的程度:

代码语言:javascript
复制
WITH x AS (
    SELECT t, val
          ,@(lead(val) OVER w + lag(val) OVER w - 2*val) AS deviate
    FROM   tbl
    WINDOW w AS (ORDER BY t)
    ORDER  BY t
    )
SELECT t, val, deviate
FROM   x
WHERE  deviate > 0.2
   OR  deviate IS NULL;

这应该会更紧密地保留形状。此示例保留行Time: 12, Value: 5并避免您在注释中描述的效果。(您在问题中的示例并不指向此方向。)

票数 1
EN

Stack Overflow用户

发布于 2015-08-09 00:50:45

Ramer Douglas Peucker会在这里工作-单位应该是一个问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/10746115

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档