我正在使用ELKI库,并且已经使用DBSCAN实现了集群,但是由于使用的dataset Im随着时间的推移而增长,所以我想使用增量集群算法。我找到了这个关于增量式DBSCAN算法的纸。论文说,该算法是用ELKI实现的,这种实现是对ELKI的贡献。但不幸的是,我不知道如何增量地使用DBSCAN。
发布于 2016-04-21 16:12:49
我想我们还没有收到这份对ELKI的贡献。
试着联系作者。我们希望能做出这样的贡献。
可以修改ELKI中的GriDBSCAN和ParallelDBSCAN实现以执行增量DBSCAN集群,只要您只有插入,而不是删除。
然而,构建一个良好的增量DBSCAN要困难得多:何时以及如何报告“结果”?常规DBSCAN有一个明确定义的结果,但是增量DBSCAN?数据是如何在中间存储的?
如果您的数据集随着时间的推移继续增长,您可能也需要更改参数。例如,减少epsilon或增加分钟数。根据更新的速度,重新运行DBSCAN可能同样有效。
https://stackoverflow.com/questions/36769835
复制相似问题