首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >对GROUP的SQL查询,返回符合最少条件的组,合并

对GROUP的SQL查询,返回符合最少条件的组,合并
EN

Stack Overflow用户
提问于 2018-06-28 09:26:52
回答 1查看 177关注 0票数 2

我想编写一个SQL查询,调用几个条件有点复杂的列。我正在使用RMySQL包开发R Studio。我的服务器是MySQL。

桌子看起来像这样。

代码语言:javascript
复制
organisation    Tour_ID             A           B           C           D  
Ikea                  a    2018-04-01  2018-05-07  2018-05-09  2018-05-01
Ikea                  a    2018-06-01  2018-05-03  2018-05-29          NA   
Ikea                  a    2018-04-02  2018-05-01  2018-07-08  2018-05-26 
Ikea                  b    2018-06-02  2018-05-01          NA  2018-05-26
Ikea                  b    2018-06-02  2018-05-01          NA  2018-05-26
Ikea                  b            NA  2018-05-05  2018-08-02  2018-06-01
Ikea                  c    2018-06-01  2018-05-07  2018-05-09  2018-05-01
Ikea                  c    2018-06-01  2018-05-03          NA          NA   
Ikea                  c    2018-08-02  2018-05-09  2018-07-08  2018-05-26

这就是我想要做的:

  1. 过滤organisation = Ikea所在的行
  2. 群由Tour_ID这样的: Tour_ID A B C D宜家2018-04-01 2018-05-07 2018-05-09 2018-05-01宜家2018-06-01 2018-05-03 2018-05-29 NA Ikea 2018-04-02 2018-05-01 2018-07 2018-07-08宜家b 2018-06-02 2018-05-01 NA 2018-05-26宜家b 2018-06-02 2018-05-01 NA 2018-05-26宜家b 2018-05-05 2018-08-02宜家2018-06-01宜家2018-06-01 2018-05 2018-05- 0507 2018-05-09 2018-05-01宜家c 2018-06-01 2018-05-03 NA Ikea c 2018-08-02 2018-05-09 2018-07-08 2018-05-26
  3. 在每组Tour_ID中,查看ABCD列中最早的日期。如果组中四列中最早的日期在2018-05-012018-05-31之间,则返回整个组。如果一行包含NA值,我想忽略NA,看看其他值中最早的日期是什么。例如,对于Tour_ID = a组,最早的日期是2018-04-01,因此它不符合标准。

总之,只有Tour_ID = bTour_ID = c符合条件的组。其结果应该是:

代码语言:javascript
复制
organisation    Tour_ID             A           B           C           D
Ikea                  b    2018-06-02  2018-05-01          NA  2018-05-26
Ikea                  b    2018-06-02  2018-05-01          NA  2018-05-26
Ikea                  b            NA  2018-05-05  2018-08-02  2018-06-01
Ikea                  c    2018-06-01  2018-05-07  2018-05-09  2018-05-01
Ikea                  c    2018-06-01  2018-05-03          NA          NA   
Ikea                  c    2018-08-02  2018-05-09  2018-07-08  2018-05-26

如何编写SQL查询?这是我的尝试,但我不知道如何做groupby,以及如何返回整个组,而不仅仅是带有最早日期的行。

代码语言:javascript
复制
SELECT *
FROM myTable 
WHERE organisation LIKE 'Ikea' AND
GROUP BY 'Tour_ID' AND
LEAST(COALESCE(A, '2019-01-01'), COALESCE(B, '2019-01-01'), COALESCE(C, '2019-01-01'), COALESCE(D, '2019-01-01')) >= '2018-05-01' AND
LEAST(COALESCE(A, '2019-01-01'), COALESCE(B, '2019-01-01'), COALESCE(C, '2019-01-01'), COALESCE(D, '2019-01-01')) < '2018-06-01';

(“2019-01-01”将取代NAs)

感谢您的各种帮助!

补充:在Gordon的回答之后,我在这里重写了SQL语句。

代码语言:javascript
复制
"SELECT t.* FROM myTable JOIN (SELECT organisation, Tour_ID 
                                                   FROM myTable
                                                   WHERE organisation LIKE 'Ikea' AND
                                                   GROUP BY organisation, Tour_ID
                                                   HAVING LEAST(COALESCE(MIN(A), '2119-01-01'), 
                                                                COALESCE(MIN(B), '2119-01-01'), 
                                                                COALESCE(MIN(C), '2119-01-01'), 
                                                                COALESCE(MIN(D), '2119-01-01')) >= '2018-05-01' AND
                                                          LEAST(COALESCE(MIN(A), '2119-01-01'), 
                                                                COALESCE(MIN(B), '2119-01-01'), 
                                                                COALESCE(MIN(C), '2119-01-01'), 
                                                                COALESCE(MIN(D), '2119-01-01')) < '2018-06-01'
                                                  ) tt
                                                  ON tt.Tour_ID = t.Tour_ID AND
                                                     tt.organisation = t.organisation"

我从RMySQL包运行了RMySQL。但我得到了以下错误。我不明白,因为GROUP BY部分看起来很好。有人知道我为什么会犯这个错误吗?

代码语言:javascript
复制
dbGetQuery(connection = connection, statement = condition)

Error in .local(conn, statement, ...) : could not run statement: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'GROUP BY organisation, Tour_ID HAVING LEAST(COALESCE(A' at line 1
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-06-28 10:59:59

首先获得匹配条件的tour_id

代码语言:javascript
复制
SELECT Tour_ID
FROM myTable 
WHERE organisation LIKE 'Ikea'
GROUP BY Tour_ID
HAVING LEAST(COALESCE(MIN(A), '2019-01-01'), COALESCE(MIN(B), '2019-01-01'), COALESCE(MIN(C), '2019-01-01'), COALESCE(MIN(D), '2019-01-01')) >= '2018-05-01' AND
       LEAST(COALESCE(MIN(A), '2019-01-01'), COALESCE(MIN(B), '2019-01-01'), COALESCE(MIN(C), '2019-01-01'), COALESCE(MIN(D), '2019-01-01')) < '2018-06-01';

然后将其放入查询中以获取原始行。有一种方法:

代码语言:javascript
复制
select t.*
from mytable t join
     (SELECT organisation, Tour_ID
      FROM myTable 
      WHERE organisation LIKE 'Ikea'
      GROUP BY organisation, Tour_ID
      HAVING LEAST(COALESCE(MIN(A), '2019-01-01'), COALESCE(MIN(B), '2019-01-01'), COALESCE(MIN(C), '2019-01-01'), COALESCE(MIN(D), '2019-01-01')) >= '2018-05-01' AND
             LEAST(COALESCE(MIN(A), '2019-01-01'), COALESCE(MIN(B), '2019-01-01'), COALESCE(MIN(C), '2019-01-01'), COALESCE(MIN(D), '2019-01-01')) < '2018-06-01'
     ) tt
     ON tt.tour_id = t.tour_id AND
        tt.organisation = t.organisation;
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51079281

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档