首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >Apache Hadoop中的组合器函数与Gora

Apache Hadoop中的组合器函数与Gora
EN

Stack Overflow用户
提问于 2019-01-02 17:17:57
回答 1查看 58关注 0票数 3

我有一个简单的Hadoop,Nutch 2.x,Hbase集群。我必须写一个MR作业,这将找到一些统计数据。这是两个步骤的工作,即,我认为我也需要组合器功能。在简单的Hadoop作业中,这不是一个大问题,因为给出了很多指南,例如this one。但我找不到任何选项来使用Gora的组合器。我的统计数据将被添加到Hbase的页面中,这就是为什么我不能关于Gora (我想)。以下是我希望在其中添加com的代码片段

代码语言:javascript
复制
GoraMapper.initMapperJob(job, query, pageStore, Text.class, WebPage.class,
        My_Mapper.class, null, true);


    job.setNumReduceTasks(1);

    // === Reduce ===
    DataStore<String, WebPage> hostStore = StorageUtils.createWebStore(
        job.getConfiguration(), String.class, WebPage.class);
    GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);
EN

回答 1

Stack Overflow用户

发布于 2019-01-15 06:39:33

我从来没有在Gora中使用过组合器,但是它能工作吗(或者它显示了什么错误):

代码语言:javascript
复制
GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);
job.setCombinerClass(My_Reducer.class);

编辑:在Apache's Jira about the Combiner上创建了一个问题。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/54003803

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档