首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >猪-在内部连接结果上进行聚合

猪-在内部连接结果上进行聚合
EN

Stack Overflow用户
提问于 2014-11-28 07:39:31
回答 1查看 96关注 0票数 1

我在两张桌子上做了一个内连接。然而,我无法在其中一个云上进行求和:

执行的查询:

代码语言:javascript
复制
sample1 = load '/user/tweets/samples.csv' using PigStorage AS (line:chararray);
words = FOREACH sample1 GENERATE FLATTEN(TOKENIZE(REPLACE(LOWER(TRIM(line)),'[\\p{Punct},\\p{Cntrl}]',''))) AS word
newinnerjoin = join words by word, wordlexion by lexword;

下面是表的输出: newinnerjoin

代码语言:javascript
复制
(important,important,2)
(irritated,irritated,-3)
(promoting,promoting,1)
(promoting,promoting,1)
(appreciate,appreciate,2)
(confidence,confidence,2)

我想在内部联接结果的第3列上执行聚合。所以,我想将和计算为2+ -3 +1+1+2+2=5,我可以不把内部连接结果存储在csv文件中吗?请给我建议。

谢谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-11-28 15:47:39

你能加3行代码让我知道结果吗?

代码语言:javascript
复制
A = GROUP newinnerjoin  ALL;
B = FOREACH A GENERATE SUM(newinnerjoin.$2);
DUMP B;
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/27183996

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档