首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >在arules中一步与两步相结合的规则挖掘--为什么它有区别?

在arules中一步与两步相结合的规则挖掘--为什么它有区别?
EN

Stack Overflow用户
提问于 2014-09-17 15:48:50
回答 1查看 261关注 0票数 0

根据我的理解,Apriori算法首先找到所有满足支持阈值的频繁项集,然后从满足最小置信度的频繁项集中生成强关联规则。

因此,我期望在R包条款中:

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="frequent itemsets")) rules <- ruleInduction(itemsets)

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

会导致相同的规则,但是在第二个例子中可以找到更多的规则,我不明白为什么。

有人能解释一下为什么吗?我正试着把我的头挪开一会儿.

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-09-18 08:40:56

好的..。现在我知道问题出在哪里了。

对于任何遇到类似问题的人来说。问题是,信心应该(当然)在ruleInduction()步骤中设置,而不是在查找所有项目集时设置。因此,只有支持才是相关的。因为我没有在ruleInduction()步骤中给出信任值,所以使用了信任的默认值0.8,从而找到了更少的规则。

这样做:

txs <- as(inputDataTable,"transactions") itemsets <- apriori(txs, parameter = list(support = 0.05, target="frequent itemsets")) rules <- ruleInduction(itemsets, confidence = 0.7)

txs <- as(inputDataTable,"transactions") rules <- apriori(txs, parameter = list(support = 0.05, confidence = 0.7, target="rules"))

也会导致同样的结果。:)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25895057

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档