我有150张照片,10个不同的人各15张。所以基本上我知道哪种形象应该属于一起,如果聚在一起。
这些图像有73维(特征向量),我用matlab中的kmeans函数将它们聚成10组。
后来,我对这150个数据点进行了处理,并将其维数从73降到了3,并对它们应用了相同的kmeans函数。
我想通过应用相同的k-均值函数来比较在这些数据集(已处理和未处理)上获得的结果,并希望知道将其降到较低维的处理是否改善了kmeans聚类。
我认为比较每个簇的方差可以是比较的一个参数,但是我不确定我是否能够直接比较和评估我的结果(距离的聚类和等)。因为这两种情况都有不同的维度。有谁能给我建议一种方法,我可以比较K平均的结果,一些方法来规范他们或任何其他的比较,我可以做吗?
发布于 2016-01-29 15:49:56
我能想到三种选择。我不知道有任何完善的方法来做这一点,特别是与K-均值聚类。
3的问题是,距离度量会被扭曲,3D距离和73D距离是不相称的,所以我不喜欢这种方法。我建议你读一些关于K的书--意思是如果你坚持这条路,排名推测是很有趣的,但是站在巨人的肩膀上会更好。
https://stackoverflow.com/questions/35086249
复制相似问题