我正在使用mlxtend查找关联规则:
代码如下:
df = apriori(dum_data, min_support=0.4, use_colnames=True)
rules = association_rules(df, metric="lift", min_threshold=1)
rules2=rules[ (rules['lift'] >= 1) & (rules['confidence'] >= 0.7) ]输出:
antecedents consequents antecedentsupport consequentsupport support confidence lift leverage conviction
frozenset({'C'}) frozenset({'B'}) 0.63 0.705 0.45 0.726 1.030 0.013 1.077
frozenset({'A'}) frozenset({'B'}) 0.98 0.705 0.69 0.70 1.003 0.0007 1.00081
frozenset({'A', 'C'}) frozenset({'B'}) 0.63 0.705 0.45 0.72 1.030 0.013 1.0776我已经给了一个min support=0.4。antecedentsupport、consequentsupport和support之间的区别是什么
lift and leverage?是什么意思?如何判断它的好坏?
置信度我可以理解的是,对于输出中的第一个规则,C和B一起出现的次数。?对吗?
发布于 2020-06-22 03:59:06
以第三个规则({A,C} => {B})为例:
support = support of {A,B,C} | support意味着,您计算包含{A,B,C}中所有三个的事务数,并将其除以事务总数。
antecedentsupport =支持先于=>的内容,表示支持{A,C}
结果支持=支持=>之后的内容,表示支持{B}
置信度=在我们观察到{A,C}之后,事务另外包含{B}的可能性有多大。可以将其视为条件概率p(给定{A,C},则B)。
Lift : lift的定义可以在这里找到:wikipedia。这意味着,如果升力<1,则{A,C}和{B}一起出现的频率低于预期。如果升力大于1,则C}和{B}一起出现的频率比预期的要高。
杠杆作用大致相同。它还比较了预期的共现和观察到的共现。进一步的解释,例如here
什么是一个好的提升/杠杆是主观的,但我建议提升> 1。如果涉及到规则,我会更多地考虑信心。
https://stackoverflow.com/questions/62457495
复制相似问题