根据我的理解,Apriori算法首先找到所有满足支持阈值的频繁项集,然后从满足最小置信度的频繁项集中生成强关联规则。
因此,我期望在R包条款中:
txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets")) rules <- ruleInduction(itemsets)
和
txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))
会导致相同的规则,但是在第二个例子中可以找到更多的规则,我不明白为什么。
有人能解释一下为什么吗?我正试着把我的头挪开一会儿.
发布于 2014-09-18 08:40:56
好的..。现在我知道问题出在哪里了。
对于任何遇到类似问题的人来说。问题是,信心应该(当然)在ruleInduction()步骤中设置,而不是在查找所有项目集时设置。因此,只有支持才是相关的。因为我没有在ruleInduction()步骤中给出信任值,所以使用了信任的默认值0.8,从而找到了更少的规则。
这样做:
txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, target="frequent itemsets")) rules <- ruleInduction(itemsets, confidence = 0.7)
和
txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))
也会导致同样的结果。:)
https://stackoverflow.com/questions/25895057
复制相似问题