我在一个事务对象上使用了arules包中的apriori命令,其中一个事务对象的CPU在20分钟左右的时间内达到了97%左右。然后它下降到0.7%到0.3%之间的周期,并且已经这样做了大约24小时。在RStudio中,我没有看到提示符;只是在眨眼。我有2666笔交易和376个项目。一些事务之间可能有很多相似之处,这意味着一些事务可以共享100多个项目。
这是我第一次使用这个包,所以我想知道这种行为是否正常,或者我应该怎么做。
我在CentOS 7上运行,有24 GB内存和16个CPU,使用的是RStudio服务器。
我的命令:
rules <- apriori(adjacdmMtrans, parameter =list(support = 0.002, confidence=0.75))输入上述命令后arules输出的一些信息:
Apriori
Parameter specification:
confidence minval smax arem aval originalSupport support minlen maxlen target ext
0.75 0.1 1 none FALSE TRUE 0.002 1 10 rules FALSE
Algorithmic control:
filter tree heap memopt load sort verbose
0.1 TRUE TRUE FALSE TRUE 2 TRUE
Absolute minimum support count: 5
set item appearances ...[0 item(s)] done [0.00s].
set transactions ...[376 item(s), 2666 transaction(s)] done [0.03s].
sorting and recoding items ... [376 item(s)] done [0.01s].
creating transaction tree ... done [0.00s].
checking subsets of size 1 2 3 4发布于 2016-07-30 20:57:04
您的机器可能耗尽了R进程的内存,并开始交换内存。在最坏的情况下,apriori必须为376个条目创建长度为4的10^12个候选条目。从更高的支持值开始。
https://stackoverflow.com/questions/38665097
复制相似问题