https://wiki.apache.org/pig/UDFManual
示例UDF对exec方法中的输入元组进行了null-check。各种内置方法有时有效,有时无效。
是否确实存在Pig脚本会导致使用空输入元组调用UDF的情况?当然,空的输入元组是正常的,也是预期的,或者是一个空值的元组,但我从来没有将元组本身设置为空。
发布于 2015-07-04 18:47:19
因为先前的UDF返回null,所以元组可能为null。想想日志分析系统,在那里你1.解析日志,2.用外部数据丰富它。
LOG --(PARSER)--> PARSED_LOG --(ENRICHENER)--> ENRICHED_LOG如果某个日志LOG格式错误,无法解析,则自定义项PARSED_LOG可能会返回null。因此,如果直接使用,ENRICHENER必须测试输入。
您也可以在之前对这些空值执行FILTER操作,特别是在多次使用元组或STORED的情况下。
发布于 2016-06-29 04:14:39
在使用Pig一段时间后,我最好的理解是,从不传递空的空值,总是一个非空的元组(其本身可能包含空值)。
https://stackoverflow.com/questions/31195212
复制相似问题