首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >是否有可能在大型稀疏矩阵上使用scikit TSNE?

是否有可能在大型稀疏矩阵上使用scikit TSNE?
EN

Stack Overflow用户
提问于 2017-09-26 13:04:05
回答 1查看 4K关注 0票数 4

scikit文档解释说,fit_transform只能用于密集矩阵,但我有一个csr格式的稀疏矩阵,我想对它执行tsne。文档说要对稀疏矩阵使用fit方法,但这并不返回低维嵌入。

我很感谢我可以像在.todense()中一样使用这个问题方法,但是我的数据集非常大(0.4*10^6行和0.5*10^4列),所以内存中不适合使用。真的,用稀疏矩阵来做这件事是很好的。是否有一种方法可以使用scikit TSNE (或TSNE的任何其他python实现)来降低大型稀疏矩阵的维数,然后返回低维嵌入以进行可视化?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-09-26 13:10:00

从同一份文件中:

强烈建议使用另一种降维方法(例如,对于密集数据使用PCA或对于稀疏数据使用TruncatedSVD ),以便在特征数量非常多的情况下将维数减少到合理的数量(例如50)。这将抑制一些噪音,并加快计算样本之间的配对距离。

使用sklearn.decomposition.TruncatedSVD代替。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/46427374

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档