问项目到项目的协同过滤，如何管理相似度矩阵？
EN

Stack Overflow用户

提问于 2017-03-02 10:31:45

回答 1查看 357关注 0票数 0

我正在开发一个推荐引擎，我现在面临的一个问题是项目的相似度矩阵太大了。

我计算了20,000个项目的相似度矩阵，并将它们存储在一个二进制文件中，该文件调整后接近1 GB。我觉得它太大了。

如果你有这么多项目，处理相似度矩阵的最好方法是什么？

任何建议！

回答已采纳

发布于 2017-05-10 00:25:09

实际上，相似度矩阵是关于对象与另一个对象的相似度。每一行由对象的邻居组成(行id)，但是你不需要存储所有的邻居，例如只存储20个邻居。使用lil_matrix：from scipy.sparse import lil_matrix

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/42545775

复制

相似问题

问项目到项目的协同过滤，如何管理相似度矩阵？EN