给定包含n个向量的数据(m×1 )。我想根据距离对数据进行聚类。此外,数据中的每个向量都被标记为某个类别。我使用kmeans算法(在Matlab中)对数据进行聚类。我希望非集群将只包括一个类别的数据。有什么方法可以添加这个约束,或者任何算法可以这样做吗?谢谢!
发布于 2022-03-02 23:30:15
您没有提到是否必须获得特定数量的集群k。假设没有,确保集群中没有一个只包含一个类别的一个简单选项是减少集群k的数量:
同样的思想也可以用于分层聚类。分层聚类的优点是只运行一次算法,然后可以选择在集群层次结构中停止哪个级别。
https://datascience.stackexchange.com/questions/108683
复制相似问题