首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >具有两个特征的相似性度量

具有两个特征的相似性度量
EN

Data Science用户
提问于 2015-10-01 15:19:58
回答 2查看 454关注 0票数 1

我有一些与相似度有关的问题

假设我们有一个矩阵M,其中M(i,j)是用户i和用户j之间的相似测度。

每个用户的特征是: id-user \ country \id-艺术家id-轨

为此,我选择使用Jaccard相似性度量。

Jaccard决心根据用户所听的音轨来计算用户之间的相似性。我的问题是:是否可以同时考虑id-轨和id-艺术家来衡量用户之间的相似性?

谢谢

EN

回答 2

Data Science用户

发布于 2015-10-01 18:53:46

是的,有多种不同的方式。

首先,我们可以考虑(id-artist,id-track)项作为集合的元素,并通过比较这些集合来计算Jaccard的相似性。请注意,如果艺术家的id没有提供超出轨道id的附加信息,这将给出相同的结果,而如果一个特定的轨道id可能与多个艺术家关联,则它将提供不同的结果。

其次,我们可以计算歌曲上的Jaccard相似性,然后再计算艺术家上的Jaccard相似性,然后将两者相加(可能是通过一些常数系数缩放两者)。这样,两个听同一位艺术家,但那些艺术家没有一首相同歌曲的用户,将被评为比不同艺术家听不同歌曲的用户更相似。

什么系数是有意义的?好的,您可以从每一个(也就是.5*similarity_artist+.5*similarity_track)的0.5开始,看看这是否合理,如果不是的话可以进行调整。

票数 4
EN

Data Science用户

发布于 2015-11-05 11:32:54

是的,你可以做到这一点(实际上在很多方面)。我喜欢把这个问题归结为一个分类问题,并找出适当的方法将它们结合起来。有关详细信息,请参阅:https://stats.stackexchange.com/questions/61351/how-to-combine-multiple-similarity-measures/166419#166419

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/8265

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档