首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >apache-pig dse pig扁平化使用

apache-pig dse pig扁平化使用
EN

Stack Overflow用户
提问于 2014-12-21 19:25:09
回答 1查看 156关注 0票数 1

我应该什么时候在猪中使用扁平化?无法从文档中理解。Pig中显示的错误消息和问题完全不同。它说有时flatten不能导入,但相同的flatten在某些地方可以工作。

EN

回答 1

Stack Overflow用户

发布于 2015-12-07 16:32:15

每当你对数据文件中的任何标识符使用group命令时,它都会列出与包中的标识符相关的所有元组,这有时读起来相当麻烦。所以,如果你在group子句的顶部使用flatten,它会在你的输出文件中单独列出所有的元组,使用flatten的缺点是相同record.So的乏味,为了删除dulpicate,你需要写一段额外的代码。

非扁平化代码示例:

代码语言:javascript
复制
X = GROUP A BY f1;

DUMP X;

(1,{(1,2,3)})

(4,{(4,2,1),(4,3,3)})

(8,{(8,3,4)})

扁平化代码示例:

代码语言:javascript
复制
X = GROUP A BY f1;

DUMP X;

(1,2,3)

(4,2,1)

(4,3,3)

(8,3,4)
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/27588894

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档