我在做Hadoop映射函数。我想迭代数据一次(左->右),然后迭代数据(右->左)。
第一次传递将为每个键设置一个值(,但不发出),然后第二次传递将通过,如果它有一个更好的值(在我的例子中是较低的值),它将覆盖该值。这对将在第二次通过后发出。
在存储(不释放)密钥值对然后重新访问它们时,我的选项是什么?
谢谢
发布于 2013-09-18 16:10:14
读取第一次传递中的值,并将它们存储到集合中。然后,在第二次传递中,当您继续从右到左读取时,匹配存储在集合中的值。
https://stackoverflow.com/questions/18876884
复制相似问题