首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >TotalOrderPartitioner和mrjob

TotalOrderPartitioner和mrjob
EN

Stack Overflow用户
提问于 2016-02-26 04:30:53
回答 1查看 384关注 0票数 1

在使用mrjob时,如何指定TotalOrderPartitioner?这是默认的,还是必须显式指定?我在不同的数据集上看到了不一致的行为。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-03-04 18:37:33

您可以使用job.setPartitionerClass(TotalOrderPartitioner.class);指定它

它不是默认的分区器类。默认的是HashPartitioner类。

这不是一个非常容易使用的分区系统。使用InputSampler时,必须使用TotalOrderPartitioner对输入中的数据进行预采样。

我编写了一个非常详细的教程,提供了如何使用这些这里的示例和插图(从初学者到高级用法)。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/35643517

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档