假设我有一堆数据库,这些数据库是从包含几个String元组的Pig生成的。我如何将它们全部从数据库中提取出来,并简单地使每个字符串都成为自己的“行”数据。
databags = FOREACH data GENERATE pigUdfThatMakesDataBags(data::someText); strings = FOREACH databags { ??? };
发布于 2016-02-25 01:15:41
databags = FOREACH data GENERATE pigUdfThatMakesDataBags(data::someText);
datatuples = FOREACH databags FLATTEN($0); -- Bag to Tuples
strings = FOREACH datatuples FLATTEN(TOBAG(*)); -- Tuples to Tokens'
DUMP strings;发布于 2016-02-24 22:25:00
我明白你在找压扁吗
https://stackoverflow.com/questions/35609345
复制相似问题