文章/答案/技术大牛

发布

社区首页 >问答首页 >在BigQuery中消除重复数据

问在BigQuery中消除重复数据
EN

Stack Overflow用户

提问于 2021-07-27 02:01:41

回答 2查看 45关注 0票数 0

我有一个只显示非重复值的查询，我正在寻找如何在其他查询中使用此重复数据的解决方案。

我没有创建任何内容的权限，所以我需要找到一个解决方案。

伊丹

编辑(来自“答案”)：

以下是我的表“Purchases”中的字段: user_id purchase_amount purchase_sku source device_type uuid -每行的唯一标识符

当除uuid之外的所有字段都相同时，将考虑复制。我需要返回经过重复数据消除的数据，并准备将其用于其他查询。

这是基本数据，在第5-6行和第7-8行中有重复的值

我希望显示为非重复的行，并且在复制的行上只显示一行，如下所示：

经过重复数据消除的数据

google-bigquery

sql

回答 2

Stack Overflow用户

发布于 2021-07-27 03:32:56

考虑下面的通用解决方案-您根本不需要登记所有列名-在查询中只使用uuid )

select any_value(t).*
from `project.dataset.table` t
group by to_json_string((select as struct * except(uuid) from unnest([t])))

票数 1

Stack Overflow用户

发布于 2021-07-27 03:05:26

您可以在row_number()中使用qualify

select p.*
from purchases p
where 1=1
qualify row_number() over (partition by user_id, purchase_amount, purchase_sku, source, device_type order by uuid) = 1;

您还可以使用聚合：

select purchase_amount, purchase_sku, source, device_type,
       min(uuid) as uuid
from purchases
group by 1, 2, 3, 4;

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/68534548

复制

相似问题

问在BigQuery中消除重复数据
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在BigQuery中消除重复数据EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在BigQuery中消除重复数据
EN