我有一个数据类型为2的数据库表,我想查找自上次与其同步以来被删除的记录。它有date_from和date_to列,原始数据有一个ID列object_id。date_to<>null表示它现在不存在,因此如果没有其他记录具有相同的object_id和date_to=null,则它已被删除。
我认为一个天真的实现应该是这样的:
select * from data_t2 a
where a.date_to > last_sync_date and a.date_to < current_date()
and not exists (select * from data_t2 b
where b.date_to is null and b.object_id = a.object_id);但很明显,这将是非常昂贵的。
有没有明显的更有效的方式我错过了?我怀疑没有(或者更确切地说,我应该假设删除的记录相对较少,并在RDBMS之外进行一些计算),但我认为我应该问一下,以防万一。
谢谢!
发布于 2010-01-08 07:55:54
在开始调优查询之前,确实应该运行EXPLAIN或应用一些其他诊断。否则,您将无法看到重写如何更改计划
你可以用一个外部连接重写它。例如,在MySQL中,这将比子查询快得多:
SELECT *
FROM data_t2 a
LEFT JOIN data_t2 b
ON a.object_id = b.object_id
AND b.date_to IS NULL
WHERE a.date_to > last_sync_date
AND a.date_to < current_date()
AND b.object_id IS NULL如果维度表非常大,并且有一个第一列为date_to的索引,并且date_to为NULL的行数只占整个表的一小部分,那么这样做可能会更快:
SELECT *
FROM data_t2 a
LEFT JOIN (
SELECT object_id
FROM data_t2 b
WHERE b.date_to IS NULL
)
ON a.object_id = b.object_id
WHERE a.date_to > last_sync_date
AND a.date_to < current_date()
AND b.object_id IS NULLhttps://stackoverflow.com/questions/2024500
复制相似问题