首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我应该使用哪种算法来匹配数据集之间的模式或求交?

我应该使用哪种算法来匹配数据集之间的模式或求交?
EN

Stack Overflow用户
提问于 2019-10-09 15:00:01
回答 2查看 120关注 0票数 0

我在x和y轴上画了personID和VaccinationsID。我想对那些拥有最相似的选择的疫苗的人进行分组。我正在尝试使用聚类机器学习算法。但是我不确定我应该使用这个算法还是用户协作过滤。

我的目标是实现Jaccard索引,即找到1000多人之间的交集或相似点,形成聚类并给它们贴上标签。根据相似程度,我需要对personsID进行分组。有人能告诉我哪种方法是有效的吗?此外,如果对数百万数据使用集群是可行的话

我增加了图表的截图

EN

回答 2

Stack Overflow用户

发布于 2019-10-12 11:27:17

接种疫苗的次数是整数。

只需按此值对数据进行分区,就不需要集群。

每一个接种了7种疫苗的人都会被列入名单7。

票数 0
EN

Stack Overflow用户

发布于 2019-11-20 10:04:47

经过大量的分析,我采用了K-模聚类算法.在此基础上,形成簇群。下面是K模式算法如何工作的视频链接.[https://www.youtube.com/watch?v=b39_vipRkUo]

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58307043

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档