我有一个简单的Hadoop,Nutch 2.x,Hbase集群。我必须写一个MR作业,这将找到一些统计数据。这是两个步骤的工作,即,我认为我也需要组合器功能。在简单的Hadoop作业中,这不是一个大问题,因为给出了很多指南,例如this one。但我找不到任何选项来使用Gora的组合器。我的统计数据将被添加到Hbase的页面中,这就是为什么我不能关于Gora (我想)。以下是我希望在其中添加com的代码片段
GoraMapper.initMapperJob(job, query, pageStore, Text.class, WebPage.class,
My_Mapper.class, null, true);
job.setNumReduceTasks(1);
// === Reduce ===
DataStore<String, WebPage> hostStore = StorageUtils.createWebStore(
job.getConfiguration(), String.class, WebPage.class);
GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);发布于 2019-01-15 06:39:33
我从来没有在Gora中使用过组合器,但是它能工作吗(或者它显示了什么错误):
GoraReducer.initReducerJob(job, hostStore, My_Reducer.class);
job.setCombinerClass(My_Reducer.class);编辑:在Apache's Jira about the Combiner上创建了一个问题。
https://stackoverflow.com/questions/54003803
复制相似问题