首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >极高维空间上的t-SNE

极高维空间上的t-SNE
EN

Data Science用户
提问于 2019-01-08 14:40:44
回答 2查看 471关注 0票数 3

我成功地将the应用于数字手写数据集.n=3823空间中的D=64数据点(即手写数字)(即8x8像素)。效果很好。

现在我想把n个≈60个数据点聚集在一个D≈3000维空间中。即使经过多次迭代,than交易会也比PCA糟糕得多。

对于不建议使用there的维度数(相对于数据点的数目)是否有上限?

EN

回答 2

Data Science用户

发布于 2022-04-02 15:28:58

t-SNE没有理论上界.然而,从实用的角度看,将越来越高的维数减少到较低的维数将变得越来越不切实际。这是因为t构造了高维物体对上的概率分布.在您的问题中,3000维空间中的60个数据点比64个维度中的3,823个数据点更需要计算。

另外,t是一种降维方法,而不是聚类技术.你可以直接聚集在高维空间中。

票数 1
EN

Data Science用户

发布于 2022-04-02 19:14:25

TSNE主要用于高维数据的可视化。使用TSNE进行聚类是不可取的,因为它既不保留密度也不保留距离。它只是试图确保近邻在高维上保持接近,在低维度上保持接近。但是,如果将基于密度或基于距离的聚类应用于输出,则不会给您带来好的结果。它已经在许多不同的数据集上开始了。**避免对TSNE输出进行聚类**

在维数方面,这个清楚地表明,它比其他像ISOMAP这样的算法工作得更好,即使在维数为92×112 = 10,304像素的Olivetti面数据集上也是如此。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/43675

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档