嗨,现在我正在和R学习关联规则。我有一个问题。
在交易数据中,我们考虑只购买或不购买(二进制数据)
我想知道如何对计数数据执行关联规则
例如)
item1 item2 item3
1 2 0 1
2 0 1 0
3 1 0 0第一个顾客买了两个item1s!!
但是在普通的关联规则中,计数信息被忽略了,我们如何考虑这些信息呢?
发布于 2017-04-20 03:36:36
高,定量关联规则(QAR)挖掘可能是有帮助的。
首先,您应该将每个项目的值域划分为一些集合,并给每个集合一个唯一的标签。然后,可以将原始数据集转换为包含这些标签的二进制数据集。
例如,对于item1,如果原始数据包含以下信息:
您可以将item1的value字段划分为[0,3),[3,6]和[6,9],并使用a1,a2和a3来表示它们,因此可以将'item1‘项替换为a1,a2和a3这3个其他项,并将原始数据替换为以下项。
在对每个项目执行此工作后,可以将原始数据集转换为二进制数据集。
https://stackoverflow.com/questions/42776541
复制相似问题