关于如何比较BigQuery中用于UAT测试的两个表,我正在寻求一些帮助。
目前,我在两个表中都有6个列,它们在相同的位置上都有相同的列名。
创建表脚本:
CREATE TABLE `project.mydataset.table_1` (
`ADDRESS_ID` STRING,
`ORDER_NO` STRING,
`START_DATE` STRING,
`END_DATE` STRING,
`JOB_DETAILS` STRING,
`LOAD_DATE` STRING
);
CREATE TABLE `project.mydataset.table_2` (
`ADDRESS_ID` STRING,
`ORDER_NO` STRING,
`START_DATE` STRING,
`END_DATE` STRING,
`JOB_DETAILS` STRING,
`LOAD_DATE` STRING
);下面是该表的一个示例:
ADDRESS_ID | ORDER_NO | START_DATE | END_DATE | JOB_DETAILS | LOAD_DATE
000045 | AE12345 | 2019-04-03 00:00:00 | 2019-04-21 17:14:11 | With Engineer | 2019-04-02 00:00:00现在我要做的是,通过各种检查,给出两个表之间的差异的统计数据。
例如,我编写的第一批查询之一是检查两个表中的卷(例如01/04/22 ),这给了我以下几卷:
TABLE_1 = 4317
TABLE_2 = 4431下一个是检查'ADDRESS_ID‘列中的副本,这给了我以下内容:
TABLE_1 = 67
TABLE_2 = 61但是,与编写单独的查询不同,是否有什么东西可以给我带来大量的统计数据或差异--也就是说,它会逐行检查两个表,在address键上加入一个连接,然后比较,然后告诉我整个表的不同之处?
很抱歉,我已经没有样本数据了,因为数据来自我的工作场所。
发布于 2022-06-16 22:31:54
看看Google的数据验证工具。在两个不同来源的表之间运行测试是相当不错的。
https://stackoverflow.com/questions/72651286
复制相似问题