文章/答案/技术大牛

发布

社区首页 >问答首页 >极高维空间上的t-SNE

问极高维空间上的t-SNE
EN

Data Science用户

提问于 2019-01-08 14:40:44

回答 2查看 471关注 0票数 3

我成功地将the应用于数字手写数据集.n=3823空间中的D=64数据点(即手写数字)(即8x8像素)。效果很好。

现在我想把n个≈60个数据点聚集在一个D≈3000维空间中。即使经过多次迭代，than交易会也比PCA糟糕得多。

对于不建议使用there的维度数(相对于数据点的数目)是否有上限？

pca

tsne

回答 2

Data Science用户

发布于 2022-04-02 15:28:58

t-SNE没有理论上界.然而，从实用的角度看，将越来越高的维数减少到较低的维数将变得越来越不切实际。这是因为t构造了高维物体对上的概率分布.在您的问题中，3000维空间中的60个数据点比64个维度中的3,823个数据点更需要计算。

另外，t是一种降维方法，而不是聚类技术.你可以直接聚集在高维空间中。

票数 1

Data Science用户

发布于 2022-04-02 19:14:25

TSNE主要用于高维数据的可视化。使用TSNE进行聚类是不可取的，因为它既不保留密度也不保留距离。它只是试图确保近邻在高维上保持接近，在低维度上保持接近。但是，如果将基于密度或基于距离的聚类应用于输出，则不会给您带来好的结果。它已经在许多不同的数据集上开始了。**避免对TSNE输出进行聚类**

在维数方面，这个纸清楚地表明，它比其他像ISOMAP这样的算法工作得更好，即使在维数为92×112 = 10,304像素的Olivetti面数据集上也是如此。

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/43675

复制

相似问题

问极高维空间上的t-SNE
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问极高维空间上的t-SNEEN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问极高维空间上的t-SNE
EN