首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >大型数据的NOT IN查询性能问题

大型数据的NOT IN查询性能问题
EN

Stack Overflow用户
提问于 2021-05-18 19:49:01
回答 2查看 24关注 0票数 1

我正在尝试从表中获取id和数字,条件为number不在id中。

代码语言:javascript
复制
select id,number from tmp_t where number not in (select id from tmp_t)

我已经尝试过查询,但它花费了太多的时间...大概40分钟后我就和服务器断线了。那么我该怎么做呢?数据大约有500K行。

所以我想展示的是,“这是id和数字,这些数字在id中并不存在。”因为我试图插入数字,但是数字是FK,并且取决于ID,所以我想知道id和数字,这就是为什么我使用not in。

也许有人知道?顺便说一句,im使用Postgresql-13

EN

回答 2

Stack Overflow用户

发布于 2021-05-18 21:01:09

您可以使用NOT EXISTS来编写它,尽管如果id的任何值为NULL,这些查询都会得到不同的结果(在这种情况下,NOT IN可能不会产生您想要的答案,所以从这个角度来看,not EXISTS也更好)。

代码语言:javascript
复制
select id,number from tmp_t where not exists 
    (select 1 from tmp_t a where a.id=tmp_t.number);

但是,只要work_mem足够大,您的公式也是有效的。

票数 1
EN

Stack Overflow用户

发布于 2021-05-18 21:01:09

通常情况下,NOT EXISTS更快(如果涉及空值,则不会出现意外):

代码语言:javascript
复制
select t1.id, t1.number 
from tmp_t t1
where not exists (select *
                  from tmp_t t2
                  where t2.id = t1.number)
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67585574

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档