首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Pig数据转换

Pig数据转换
EN

Stack Overflow用户
提问于 2013-11-08 03:17:11
回答 1查看 136关注 0票数 0

我们有以下示例数据,必须使用pig脚本将其转换为输出格式

<<示例TSV >>

代码语言:javascript
复制
Id    rank  Value

12324 1     1582

12324 2     1142

12324 4     1292

12324 5     1134

12325 1     1582

12325 2     1142

12325 3     1292

12325 4     1134

12325 5     1183

12326 1     1582

12326 2     1142

12326 3     1292

12326 4     1134

12326 5     1183

我们需要比较每个id的每个等级的值( value列)。

输出需要以以下格式生成

代码语言:javascript
复制
Id1                   Id2

value_rank1           value_rank1

value_rank2           value_rank2

value_rank3           value_rank3

...                   ........

value_rankn           value_rankn

例如

代码语言:javascript
复制
12324     12325   ..

1582       1582

1142       1142

        1292

1292       1134

1134       1183

对于特定id的任何缺失的排名,都必须有一个空值。

使用pig脚本有什么方法可以做到这一点吗?

EN

回答 1

Stack Overflow用户

发布于 2014-02-21 10:18:10

Pig按记录操作数据(基于行)。在ETL操作之后,它会在大多数情况下生成基于行的记录。

为了满足您的需求,我认为可以使用UDF(生成占位符)来生成如下内容:

代码语言:javascript
复制
12324, 1582, 1142, , 1292, 1134
12325, 1582, 1142, 1292, 1134, 1183

然后在其他软件中(例如,使用Excel中的“粘贴特殊->转置”)将数据从行转置到列。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/19844697

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档