我想对大型社交网络数据集使用一些聚类方法。问题是如何评价聚类方法。可以,我可以使用一些外部的、内部的和相对的集群验证方法。我使用归一化互信息(NMI)作为基于合成数据的聚类验证的外部验证方法。我对我的真实数据集使用了具有最佳NMI的聚类,并检查了我的算法的错误(成本函数),结果很好。我的成本函数的测试方法好吗?或者我还应该再次验证我的real word集群的集群?
谢谢。
发布于 2013-08-20 04:35:24
尝试不止一种方法。
有十几种集群验证方法,很难预测哪一种最适合解决问题。它们之间的区别还不是很清楚,所以最好咨询不止一个。
还要注意,如果不使用标准化度量,基线可能真的很高。因此,这些度量最有用的说法是“结果A比结果C更类似于结果B”,但不应将其作为质量的绝对度量。它们是相似性的相对度量。
https://stackoverflow.com/questions/18308868
复制相似问题