首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >猪拉丁文的百分位数计算

猪拉丁文的百分位数计算
EN

Stack Overflow用户
提问于 2014-04-11 14:41:46
回答 1查看 2.7K关注 0票数 3

我试着用猪来计算百分位数。我需要使用属性对数据进行分组,并根据sales计算组中每个元组的百分位数。

我见过没有内置的猪功能来做到这一点。想知道以前是否有人遇到过类似的问题可以帮助我。

EN

回答 1

Stack Overflow用户

发布于 2014-04-11 20:29:14

正如JaiPrakash所提到的,您可以使用Apache DataFu库中的UDF StreamingQuantile。既然我已经准备好了一个示例,我就在这里复制它。

输入

代码语言:javascript
复制
item1,234
item1,324
item1,769
item2,23
item2,23
item2,45

猪脚本

代码语言:javascript
复制
register datafu-1.2.0.jar;
define Quantile datafu.pig.stats.StreamingQuantile('0.0','0.5','1.0');
data = load 'data' using PigStorage(',') as (item:chararray, value:int);
quantiles = FOREACH (GROUP data by item) GENERATE group, Quantile(data.value);
dump quantiles;

输出

代码语言:javascript
复制
(item1,(234.0,324.0,769.0))
(item2,(23.0,23.0,45.0))
票数 6
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/23015725

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档