我理解Hadoop MapReduce及其特性,但我对R MapReduce感到困惑。
我读过的一个不同之处是,R使用最大RAM。因此,请执行与Hadoop集成的并行处理。
发布于 2014-06-27 19:37:44
拉杜普 (您感兴趣的部分现在称为rmr2)只是用R编写的MapReduce的客户端API。您可以使用interpreter调用MapReduce,并将一个R函数发送给工人,在那里由R解释器在本地执行。但在其他情况下,它完全是相同的MapReduce。
您可以这样在R中调用任何您喜欢的东西,但是没有任何R函数本身被并行化来以这种方式使用MapReduce。问题是,你可以从R中调用M/R,我不认为它能让你做比这更神奇的事情。
https://datascience.stackexchange.com/questions/613
相似问题