我的AWS QLDB表中有以下表:
INSERT INTO Testing << {
'MyId': 1,
'MyList': [ 'Item1', 'Item2', 'Item3']
},
{
'MyId': 2,
'MyList': [ 'Item2', 'Item3', 'Item4']
},
{
'MyId': 3,
'MyList': [ 'Item4', 'Item5', 'Item6']
}
>>我需要能够获得所有包含项目列表(不是来自另一个表的)的文档,我对这些文档使用了以下查询:
SELECT *
FROM Testing AS t,
t.MyList AS l
WHERE l IN ('Item1', 'Item2', 'Item4')但是,这提供了以下输出
+------+---------------------------+---------+
| MyId | MyList | _3 |
+------+---------------------------+---------+
| 3 | ["Item4","Item5","Item6"] | "Item4" |
+------+---------------------------+---------+
| 1 | ["Item1","Item2","Item3"] | "Item1" |
+------+---------------------------+---------+
| 1 | ["Item1","Item2","Item3"] | "Item2" |
+------+---------------------------+---------+
| 2 | ["Item2","Item3","Item4"] | "Item2" |
+------+---------------------------+---------+
| 2 | ["Item2","Item3","Item4"] | "Item4" |
+------+---------------------------+---------+我只想得到三个不同的行。基于我尝试使用DISTINCT时遇到的错误,QLDB不支持它,但我也希望在我的SELECT中使用*,所以我尝试使用GROUP BY
SELECT *
FROM Testing AS t,
t.MyList AS l
WHERE l IN ('Item1', 'Item2', 'Item4')
GROUP BY t.MyId但这会产生以下错误:
启动查询错误 语义错误:行中,列:没有名为‘$__partiql_group_group_by_1_item_0’的变量;没有名为'$__partiql__group_by_1_item_0‘的变量(服务: AmazonQLDBSession;状态代码: 400;错误代码: BadRequestException;请求ID: 65vrQHytqHdEL3o9Ym9Xn4)
发布于 2020-04-03 00:02:13
QLDB中目前既不支持DISTINCT也不支持GROUP BY,正如选择引用。遗漏所表明的那样,在这种情况下,错误消息具有误导性。
假设您的MyId列本身是唯一的,您可以通过检查列表中是否包含每一项来过滤列表来表达您想要的内容,如下所示:
SELECT *
FROM Testing AS t
WHERE 'Item1' IN t.MyList OR 'Item2' IN t.MyList OR 'Item3' IN t.MyList如果要进一步筛选生成的列表,可以使用原始筛选器SELECT 如前所述添加嵌套的如前所述。
SELECT t.MyId, (SELECT VALUE l FROM t.MyList WHERE l IN ('Item1', 'Item2', 'Item3'))
FROM Testing AS t
WHERE 'Item1' IN t.MyList OR 'Item2' IN t.MyList OR 'Item3' IN t.MyList虽然这有点尴尬,但是您可能还是不想做GROUP BY,因为当每个t的items包含在其中时,整个数据集(需要一个完整的聚合)都会进行分组。
https://stackoverflow.com/questions/60910236
复制相似问题