首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何解释Mlxtend的关联规则结果

如何解释Mlxtend的关联规则结果
EN

Stack Overflow用户
提问于 2020-06-19 03:00:38
回答 1查看 272关注 0票数 1

我正在使用mlxtend查找关联规则:

代码如下:

代码语言:javascript
复制
df = apriori(dum_data, min_support=0.4, use_colnames=True)
rules = association_rules(df, metric="lift", min_threshold=1)
rules2=rules[ (rules['lift'] >= 1) & (rules['confidence'] >= 0.7) ]

输出:

代码语言:javascript
复制
antecedents             consequents    antecedentsupport    consequentsupport   support confidence  lift      leverage  conviction
frozenset({'C'})        frozenset({'B'})        0.63        0.705                   0.45    0.726   1.030       0.013   1.077
frozenset({'A'})        frozenset({'B'})        0.98        0.705                   0.69    0.70    1.003       0.0007  1.00081
frozenset({'A', 'C'})   frozenset({'B'})        0.63        0.705                   0.45    0.72    1.030       0.013   1.0776

我已经给了一个min support=0.4antecedentsupportconsequentsupportsupport之间的区别是什么

lift and leverage?是什么意思?如何判断它的好坏?

置信度我可以理解的是,对于输出中的第一个规则,CB一起出现的次数。?对吗?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-06-22 03:59:06

以第三个规则({A,C} => {B})为例:

support = support of {A,B,C} | support意味着,您计算包含{A,B,C}中所有三个的事务数,并将其除以事务总数。

antecedentsupport =支持先于=>的内容,表示支持{A,C}

结果支持=支持=>之后的内容,表示支持{B}

置信度=在我们观察到{A,C}之后,事务另外包含{B}的可能性有多大。可以将其视为条件概率p(给定{A,C},则B)。

Lift : lift的定义可以在这里找到:wikipedia。这意味着,如果升力<1,则{A,C}和{B}一起出现的频率低于预期。如果升力大于1,则C}和{B}一起出现的频率比预期的要高。

杠杆作用大致相同。它还比较了预期的共现和观察到的共现。进一步的解释,例如here

什么是一个好的提升/杠杆是主观的,但我建议提升> 1。如果涉及到规则,我会更多地考虑信心。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62457495

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档