根据Hadoop :权威指南的说法。
新的API既支持“推”又支持“拉”式的迭代。在这两个API中,键值记录对被推送到映射器,但是另外,新的API允许映射器从map()方法中提取记录。减速机也是如此。“拉”样式如何有用的一个例子是分批处理记录,而不是一个接一个地处理记录。
有人在Map/Reduce函数中提取数据吗?我对相同的API或示例感兴趣。
发布于 2011-09-26 13:10:37
我发布了一个查询@ mapreduce-user@hadoop.apache.org,并得到了答案。
下一个键值对可以从传递给映射的上下文对象中检索,方法是在该对象上调用nextKeyValue()。因此,您将能够在新的API中从它中提取下一个数据。
在这种情况下,拉的性能比推好吗?另外,在什么情况下拉力将是有用的?
https://stackoverflow.com/questions/7537797
复制相似问题