首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >试图理解潜在语义索引(LSI)

试图理解潜在语义索引(LSI)
EN

Stack Overflow用户
提问于 2016-12-10 16:08:45
回答 1查看 519关注 0票数 2

我正在学习奇异值分解,我可以将这个概念用于什么目的,我正在阅读的这本书提到了SVD用于潜在语义索引。我读过一些关于LSI的文章,似乎LSI主要用于搜索引擎和类似的应用程序。我想将LSI用于我正在进行的一个小型数据分析项目,但我不确定它对我的应用程序是否有意义。这就是我正在做的事情。

我有一个大约20000个游戏的列表,这个列表的两个属性是游戏类型和发布游戏的平台。我想使用LSI来获得一些关于平台和流派属性的信息。

因此,首先我创建了一个共现矩阵,其中行代表24个不同的流派,列代表22个不同的平台。然后,我对共生矩阵进行奇异值分解,提取出前两列U和V,并为U绘制了一个2d图,V.The图如下所示。

所以我的问题是,这是否可以被认为是潜在语义索引的一种有意义的使用,以及我如何从这个图中进行解释?例如,我们看到Genre Action和platform PC远离所有其他变量,这是否告诉我们关于这个流派和平台的任何信息?

谢谢。

EN

回答 1

Stack Overflow用户

发布于 2017-04-05 17:17:16

SVD通常用于降低维度,并发现隐藏的宏观特征或模式,以获得更细粒度的行为。几乎所有的推荐系统问题都可以用这种方法来解决。

我不确定你用来实现奇异值分解的参数(如果它真的收敛了),但对你的图形有一些可能的解释:

  • 显然有两种类型的游戏平台(碰巧是真正的游戏机vs PC)
  • 有一些游戏像“运动”,主要在游戏机上玩,而其他游戏,如“射手,角色扮演,模拟,冒险”则更多的是平台不可知(在两者上都可以找到)。
  • 我不是很确定“战略”和“动作”游戏

祝好运

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41073479

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档