我有Pig脚本,只有当我在脚本的中间存储和加载一个变量时才能工作。
我的试验表明,像下面这样的序列会在不同的序列之后失败:
但是,如果我存储并随后按如下方式加载变量,同样会成功:
我的工作顺序是:
此外,我不能简单地编写存储的代码& rmf函数,因为Pig的代码优化将尝试跳过它认为无用的所有步骤(因为我存储一个变量,然后在相同的变量名上加载它)。
以前有人见过这样奇怪的行为吗?
编辑:不幸的是,我无法粘贴这里的代码。
发布于 2015-05-06 12:07:15
我们已经看到了这种行为,就像你说的--如果你不储存这些值,猪就会跳过它。
您可以编写获得元组和变量的UDF,并且只返回元组。这样,它将处理变量,因为您是字符串元组。
https://stackoverflow.com/questions/30073157
复制相似问题