随着时间的推移,我已经习惯了data.table在r中非常有用的滚动连接功能。这些功能利用了LOCF (上一次观察到的结果)的操作。不幸的是,我被迫在一个我不太熟悉的环境中工作(使用postgres)。在SQL中有类似的操作(特别是postgres)吗?
以下是我所拥有的内容和我想要的输出的示例:
这是我的第一张表
dt1 = data.table(Date=seq(from=as.Date("2013-01-03"),
to=as.Date("2013-06-27"), by="1 day"),key="Date")[, ind:=.I]
Date ind
1: 2013-01-03 1
2: 2013-01-04 2
3: 2013-01-05 3
4: 2013-01-06 4
5: 2013-01-07 5
---
172: 2013-06-23 172
173: 2013-06-24 173
174: 2013-06-25 174
175: 2013-06-26 175
176: 2013-06-27 176这是我的第二张表
dt2 = data.table(Date=seq(from=as.Date("2013-01-01"),
to=as.Date("2013-06-30"), by="1 week"),key="Date")
Date
1: 2013-01-01
2: 2013-01-08
3: 2013-01-15
4: 2013-01-22
5: 2013-01-29
---
22: 2013-05-28
23: 2013-06-04
24: 2013-06-11
25: 2013-06-18
26: 2013-06-25下面是我将在data.table中使用的代码,以获得所需的输出。
dt1[dt2, roll=Inf]
Date ind
1: 2013-01-01 NA
2: 2013-01-08 6
3: 2013-01-15 13
4: 2013-01-22 20
5: 2013-01-29 27
---
22: 2013-05-28 146
23: 2013-06-04 153
24: 2013-06-11 160
25: 2013-06-18 167
26: 2013-06-25 174使用postgres (或者更广泛地说,SQL )可以做到这一点吗?非常感谢您能提供的任何帮助。
发布于 2014-05-13 12:51:05
我真的很想看看是否有人可以在不先填充完整的交叉连接表的情况下做到这一点。但是这里有一个交叉连接的解决方案:
http://sqlfiddle.com/#!2/b2f3f/3/0
创建架构:
CREATE TABLE Table1
(`t1` double, `ind` int)
;
INSERT INTO Table1
(`t1`, `ind`)
VALUES
(1, 1),
(1.9, 2),
(3.1, 3),
(4, 4),
(5.1, 5),
(5.9, 6)
;
CREATE TABLE Table2
(`t2` int)
;
INSERT INTO Table2
(`t2`)
VALUES
(1),
(2),
(3),
(4),
(5),
(6)
;查询:
select t2, max(ind)
from (select t2, ind
from table1
cross join table2
where t1 <= t2) as foo
group by t2结果:
T2 MAX(IND)
1 1
2 2
3 2
4 4
5 4
6 6EDIT:@Hadley的评论是正确的,使用上面的查询永远不会实现完整的交叉连接表,因为上面的查询产生的解释和结果与下面的查询相同:
select t2, max(ind)
from table1
cross join table2
where t1 <= t2
group by t2发布于 2014-05-15 10:36:53
由于我在一个特殊的Postgres环境中工作,显然它不允许我交叉连接。非常感谢@Clayton Stanley给出了很好的答案,但我不得不尝试另一种方式。到目前为止,它看起来是有效的。我很抱歉不能对这两种方法进行时间比较。
创建模式
CREATE TABLE Table1
(`id` int,`t1` double, `ind` int)
;
INSERT INTO Table1
(`id`,`t1`, `ind`)
VALUES
(1,0.99, 5),
(1,1.90, 10),
(2,3.10, 12),
(2,4.00, 3),
(3,5.10, 8),
(3,5.90, 16),
(4,5.90, 7),
(4,5.99, 20)
;
CREATE TABLE Table2
(`id` int, `t2` double)
;
INSERT INTO Table2
(`id`,`t2`)
VALUES
(1,1.00),
(2,3.95),
(3,5.05),
(4,6.01)
;使用子查询执行连接
select B.*
from Table2 as A
join Table1 as B
on B.id=A.id
join(
select
SUBB.id,
max(SUBB.t1) as t1
from Table2 as SUBA
join Table1 as SUBB
on SUBB.id=SUBA.id and
SUBB.t1 <= SUBA.t2
group by SUBB.id
)
as subqry
on B.t1=subqry.t1 and
A.id=subqry.id示例模式和输出如下所示:
Link to schema
https://stackoverflow.com/questions/23614639
复制相似问题