我目前已经在Hadoop中实现了构建决策树的Google框架(也称为PLANET)。它从单个顶点开始,使用map reduce作业,您可以添加越来越多的作业,直到树完全构建。然而,一个主要问题是大量的map/reduce作业一个接一个地运行,因此总是启动新作业的成本非常高。
我见过很多次Apache Hama适用于像图这样的迭代算法。有人可以用Hama构建一个新的图吗?或者你只需要输入一个图并在上面做一些计算?将我的项目转移到Hama容易吗??谢谢
发布于 2012-10-14 17:14:19
Hama确实能够使用PLANET论文中描述的算法构建决策树,其方法比MapReduce有效得多。
Hama不需要图形作为输入,您可以查看Hama ML (机器学习)模块,该模块通常将原始特征向量作为直接来自HDFS的输入处理。
对于Hama,我创建了一个new issue in the Apache Jira来跟踪此算法的进度。
https://stackoverflow.com/questions/12824900
复制相似问题