我使用arules包中的apriori函数来执行项目关联分析。在将结果强制放入数据框之后,我注意到在某些情况下,输出可以像这样分组:
LHS RHS Support Confidence Lift Count
{Item1, Item2} {Item3} .84 0.99 12.3 6有没有办法强制函数只在每个事务中的两个项目之间执行分析,并产生相应的支持、置信度等?换句话说,我是否可以强制apriori将上述结果拆分为以下内容:
LHS RHS Support Confidence Lift Count
{Item1} {Item3} a b c d
{Item2} {Item3} e f g h发布于 2019-09-20 00:55:18
在挖掘之后,先验中的maxlen不起过滤器的作用。先验生成频繁项集,长度从1开始,然后是2,3,...maxlen会停止挖掘过程。
另一方面,minlen是一个过滤器,因为必须首先找到所有较短的频繁项集。
如果您问的是您是否可以确定
{Item1} -> {Item3}
{Item2} -> {Item3}仅仅是通过使用
{Item1, Item2} -> {Item3}那么答案是否定的。然而,从先验属性中,我们至少知道以下内容:
supp({Item1} -> {Item3}) >= supp({Item1, Item2} -> {Item3})
supp({Item2} -> {Item3}) >= supp({Item1, Item2} -> {Item3})https://stackoverflow.com/questions/55285628
复制相似问题