首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >项目到项目的协同过滤,如何管理相似度矩阵?

项目到项目的协同过滤,如何管理相似度矩阵?
EN

Stack Overflow用户
提问于 2017-03-02 10:31:45
回答 1查看 357关注 0票数 0

我正在开发一个推荐引擎,我现在面临的一个问题是项目的相似度矩阵太大了。

我计算了20,000个项目的相似度矩阵,并将它们存储在一个二进制文件中,该文件调整后接近1 GB。我觉得它太大了。

如果你有这么多项目,处理相似度矩阵的最好方法是什么?

任何建议!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-05-10 00:25:09

实际上,相似度矩阵是关于对象与另一个对象的相似度。每一行由对象的邻居组成(行id),但是你不需要存储所有的邻居,例如只存储20个邻居。使用lil_matrix:from scipy.sparse import lil_matrix

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/42545775

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档