我刚开始使用hadoop,我需要使用它来计算一个非常大的数据集的关联规则。我不能理解如何使用rules和MapReduce从数据集中发现关联规则。我有事务矩阵,但是我需要做什么才能用hadoop对这个矩阵执行apriori算法??这是用于执行apriori (程序包规则)的命令。
rules <- apriori(incidence.matrix , parameter = list(minlen=2, supp=0.09, conf=0.95))我需要在map函数中使用它,在reduce函数中吗?
发布于 2015-02-25 09:19:50
我也有同样的问题(R在规则的大数据集上崩溃),你可以使用Hadoop ,它是一个基于的机器学习引擎,它有关联规则和其他机器学习算法(如聚类)。等)
https://stackoverflow.com/questions/27374801
复制相似问题