我是机器学习的新手,我想在MATLAB中实现与距离相关的中餐厅过程,用于音频轨迹的聚类。
我想在26个特征上使用dd。我猜这个过程可能是这样的
我将运行该算法,例如,16声道。音频输入算法的方式是,第一个特征向量来自音频轨道1中的第一个帧,第二个特征向量来自于轨道2中的第一个帧,因为我试图找出哪些音频轨道最喜欢聚在一起,但我不想定义有多少质心。显然,我将不得不跟踪哪一个音频轨道是在哪个“桌子”。
这有道理吗?
发布于 2013-11-13 15:04:37
这不是中式餐厅的过程。这是一种与中餐过程有一定相似性的启发式算法。在CRP中,所有的内容都是按照项目分配到集群的优先级(表类推)来表述的,它们与每个集群的似然函数结合在一起(这就形成了您所描述的相似函数)。然后,通过Gibbs抽样进行推断,这意味着在给定所有其他赋值的情况下,对每条轨道依次分配哪一组不确定的抽样。非参数化的变分方法仍处于非常初步的状态.
你为什么要用CRP?你认为除了传统的聚类方法之外,你还能从中得到一些东西吗?实现和正确理解非参数化的入门门槛相当高,而且由于我提到的推理方面的限制,目前它们通常没有什么实际用途。
发布于 2013-11-12 21:12:46
您可以使用X-means算法,它根据贝叶斯信息准则(或BIC)自动确定质心的最优数目(以及簇数)。简而言之,该算法寻找每个集群的密度,以及每个集群离另一个集群有多远。
https://stackoverflow.com/questions/19934307
复制相似问题