首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >json字段上的ElephantBird UDF: ORDER生成语法错误

json字段上的ElephantBird UDF: ORDER生成语法错误
EN

Stack Overflow用户
提问于 2014-10-01 05:21:38
回答 1查看 93关注 0票数 0

我在Hadoop 1.2.1上使用Pig 0.13.0。为了处理JSON文件,我还使用了ElephantBird UDF版本的4.5。直到现在,我在UDF方面还没有什么大问题,但是当我尝试用json字段订购别名时,pig编译器并不高兴,我得到了以下错误:

代码语言:javascript
复制
Failed to parse: <file find.pig, line 13, column 35>  Syntax error, unexpected symbol at or near 'long'

脚本如下所示(查看ORDER语句):

代码语言:javascript
复制
...
records = LOAD '$INPUT' USING com.twitter.elephantbird.pig.load.JsonLoader('-nestedLoad') AS (json:map[]);
sorted_records = ORDER records BY (long)json#'imp' desc;
...

我试着移除(长),但没有结果。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-10-01 14:27:35

不能按JsonLoader返回的映射中的值排序记录,也不能在order by中进行类型转换。您可以做的是将json#'imp'的值投影到记录中的一个字段中,然后通过以下方式进行排序:

代码语言:javascript
复制
records = FOREACH records GENERATE json, (long)json#'imp' AS imp:long;
sortedrecords = ORDER records BY imp desc;
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/26134601

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档