我有一个客户位置流数据,我需要分析和检查每个事件,如果位置是他通常访问的位置或不是,并生成实时警报,如果不是他经常访问的位置。我在寻找各种聚类算法,但找不到一个好的‘实时’的。
Kmeans对中心数的要求太严格了。DBSCAN很重,不确定它是否足够快来实时响应...
你能推荐一个适合实时流处理的吗?
发布于 2016-06-01 23:24:12
我相信DBSCAN是足够合适的。它的最坏情况下的复杂度为O(n2),与其他传统算法(如分层算法)相比已经足够好了。与kmeans相比,我认为kmeans适用于使用SpatiaLIte或PostGIS等空间数据库中的ST_Centroid函数(想当然地认为您使用的是地理数据)。在kmeans和DBSCAN之间,我选择DBSCAN是因为我认为您的问题的答案是关于实时数据的基于密度的方法。
https://stackoverflow.com/questions/35762545
复制相似问题