我想用efficient_apriori包来计算关联规则。The problem is that 12 millions observations are too many,所以计算占用了太多的时间。如果你想看我的代码: import pandas as pd
customer = orders.groupby("id
我使用Christian Borlget的FP-Growth和Apriori包来查找频繁项集和关联规则。根据his paper的说法,fp-growth在所有情况下都比先验的表现更好。在我的机器上运行FP-Growth,在一个大约36MB(大约500,000行)的csv文件上显示: from fim import apriori, fpgrowthfpzmin=2, report="C,S") # tracts is a list of listspri
我正在研究一套超过22,000条记录的数据集,当我用apriori模型尝试它时,它所花费的时间太长了,即使是对像20这样的少量记录来说也是如此。我的代码中有问题吗?还是有更快的方法可以快速地将分析人员转换成一个列表呢?我使用的代码如下。20):
from apyori import aprioriassociations = apriori(transactions, mi