我成功地将the应用于数字手写数据集.n=3823空间中的D=64数据点(即手写数字)(即8x8像素)。效果很好。
现在我想把n个≈60个数据点聚集在一个D≈3000维空间中。即使经过多次迭代,than交易会也比PCA糟糕得多。
对于不建议使用there的维度数(相对于数据点的数目)是否有上限?
发布于 2022-04-02 15:28:58
t-SNE没有理论上界.然而,从实用的角度看,将越来越高的维数减少到较低的维数将变得越来越不切实际。这是因为t构造了高维物体对上的概率分布.在您的问题中,3000维空间中的60个数据点比64个维度中的3,823个数据点更需要计算。
另外,t是一种降维方法,而不是聚类技术.你可以直接聚集在高维空间中。
发布于 2022-04-02 19:14:25
TSNE主要用于高维数据的可视化。使用TSNE进行聚类是不可取的,因为它既不保留密度也不保留距离。它只是试图确保近邻在高维上保持接近,在低维度上保持接近。但是,如果将基于密度或基于距离的聚类应用于输出,则不会给您带来好的结果。它已经在许多不同的数据集上开始了。**避免对TSNE输出进行聚类**
在维数方面,这个纸清楚地表明,它比其他像ISOMAP这样的算法工作得更好,即使在维数为92×112 = 10,304像素的Olivetti面数据集上也是如此。
https://datascience.stackexchange.com/questions/43675
复制相似问题