首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为第一行可用的SQL BigQuery连接id上的两个表

为第一行可用的SQL BigQuery连接id上的两个表
EN

Stack Overflow用户
提问于 2021-08-05 12:42:45
回答 2查看 124关注 0票数 0

我有两个桌子,我需要加入日期和id。第一个表包含dateidname列。每个名称与几个ids相关联。数据如下:

代码语言:javascript
复制
date     id     name  
7/11     1        A
7/11     1        A
7/11     1        A
7/11     1        A
7/11     1        A
7/11     2        A
7/11     2        A
7/11     2        A
7/11     2        A
7/11     2        A

另一个表有Dateidshares。它没有与id关联的名称。这张桌子是这样的:

代码语言:javascript
复制
date     id     shares  
7/11     1        5
7/11     2        4

最终目标是获取每个名称的共享的总和,或者更确切地说,获取与名称关联的ids列表的总和。以下是代码:

代码语言:javascript
复制
SELECT t1.date, t1.name,
       COALESCE(SUM(t2.shares), 0) shares
FROM table1 t1 LEFT JOIN table2 t2
ON t2.date = t1.date AND t2.id = t1.id
GROUP BY t1.date, t1.name

这是非常好的工作,但因为table_1列出相同的id 5倍,之和是5倍,它应该是。因此,我只需要从联接中的表1中获取第一行。所需的输出如下:

代码语言:javascript
复制
date     name     shares 
7/11      A          9
EN

回答 2

Stack Overflow用户

发布于 2021-08-05 12:48:12

我认为您应该修复您的数据模型,以便没有重复。一种选择是在加入之前删除重复项:

代码语言:javascript
复制
SELECT t1.date, t1.name,
       COALESCE(SUM(t2.shares), 0) as shares
FROM (SELECT DISTINCT t1.date, t1.id, t1.name
      FROM table1 t1
     ) t1 LEFT JOIN
     table2 t2
     ON t2.date = t1.date AND t2.id = t1.id
GROUP BY t1.date, t1.name
票数 1
EN

Stack Overflow用户

发布于 2021-08-05 19:37:50

如果无法修复基础数据以删除重复数据,那么使用CTE(或子查询)可能是个好主意。

代码语言:javascript
复制
with 
    table_a as (select * from `project.dataset.table_a`),
    table_b as (select * from `project.dataset.table_b`),
    deduped_a as (select distinct date, id, name from table_a)
select
    date,
    name,
    sum(coalesce(shares,0)) as shares
from deduped_a
left join table_b using(id, date)
group by 1,2
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68666837

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档