首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >哪种算法最适合于得出数据集中两个人之间的最佳匹配?

哪种算法最适合于得出数据集中两个人之间的最佳匹配?
EN

Data Science用户
提问于 2019-06-30 14:36:58
回答 1查看 189关注 0票数 2

假设我有一个包含以下数据的大数据集;

代码语言:javascript
复制
username,age,sex,music_genre,sports_genre,art_genre,rating
DanTheMan,25,male,rock,football,cubsim,50
LoopyLucy,23,female,pop,null,popart,76
MadDog,33,null,pop,football,cubsim,57

我想要运行整个数据集,并匹配两个用户基于̶t̶a̶S̶t̶e̶e̶̶

类型和等级相似或接近于其他人喜欢最好的匹配。性别不需要考虑,获得这一结果的最佳算法是什么?有相同数量的用户,每个人都会得到一个匹配。

我已经看过稳定的婚姻算法(Gale-Shapley),但是我会感谢别人的建议和意见。

谢谢!

EN

回答 1

Data Science用户

回答已采纳

发布于 2019-06-30 23:06:06

根据你的数据样本,除非你有一种更微妙的方法来衡量某一类型的不同价值之间的相似性(例如,其他一些资源表明足球更接近篮球,而不是网球),否则你唯一能使用的相似性度量方法是计算两个用户有多少相同的口味。

相似度只能是0,1,2或3,所以我不认为你真的需要聚类。您可以简单地构建一个地图,其中的关键是3“类型”列的连接,而值是具有这些品味的用户集合。有些用户可能没有完全匹配的(3种相同的类型),所以您做相同的过程,但只有两个类型的共同,然后只有一个。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/54789

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档