我正在尝试把一个通用的脚本在猪拉丁,我需要过滤数据基于最后一列。
我的数据集将有不同的列数,其中我将根据最后一列进行过滤。
有没有办法让我们在Pig的最后一栏。
master = LOAD '/user/data/usps/dataset_1/' using PigStorage(',') ;
B = FILTER master BY last_column is null;发布于 2015-12-31 00:36:51
你不能使用pigstorage。但是您可以编写自己的自定义加载器(老实说,这很容易)来解析数据并将最后一列命名为"last_column“。
https://stackoverflow.com/questions/34440784
复制相似问题