用carrot2进行“顺序聚类”是可能的。我用顺序聚类的意思是,假设我有一组im聚类的文档,然后过了一段时间,新文档就可以进行聚类,是否可以用旧的结果对新文档进行聚类,或者是否需要重新对所有文档进行聚类。
第一篇文章,所以要温柔一点。
发布于 2014-03-14 21:43:26
Carrot2不支持这种开箱即用的操作模式。根据新文档到达的频率,您可以重新聚集一个滑动的文档窗口,并将新创建的集群与旧的集群合并,以获得完整的结果。我以前没有尝试过这样的安排,所以如果它失败了,那么使用专门的在线聚类算法可能会更好。
https://stackoverflow.com/questions/22406594
复制相似问题