我已经在R中实现了randomForest算法,并尝试使用sparkR (来自Apache Spark 2.0.0)实现相同的算法。
但是我发现在sparkR https://www.codementor.io/spark/tutorial/linear-models-apache-spark-1-5-uses-present-limitations中只有像glm()实现这样的线性模型函数
并且找不到任何RandomForest (决策树算法)示例。在Spark的MLLib中有RandomForest,但也无法找到MLLib的R绑定。
请告诉我,SparkR(2.0.0)是否支持RandomForest?还有没有可能用MLlib连接SparkR来使用RandomForest?如果不是,我们如何使用SparkR来获得它呢?
发布于 2016-08-31 00:15:43
没错,到目前为止,它还不能在SparkR中使用。可能的选择是在分布式数据块上构建随机森林,并在以后合并您的树。无论如何,这都是关于随机性的。
一个很好的链接:https://groups.google.com/forum/#!topic/sparkr-dev/3N6LK7k4NB0
https://stackoverflow.com/questions/39226788
复制相似问题