我在x和y轴上画了personID和VaccinationsID。我想对那些拥有最相似的选择的疫苗的人进行分组。我正在尝试使用聚类机器学习算法。但是我不确定我应该使用这个算法还是用户协作过滤。
我的目标是实现Jaccard索引,即找到1000多人之间的交集或相似点,形成聚类并给它们贴上标签。根据相似程度,我需要对personsID进行分组。有人能告诉我哪种方法是有效的吗?此外,如果对数百万数据使用集群是可行的话

我增加了图表的截图
发布于 2019-10-12 11:27:17
接种疫苗的次数是整数。
只需按此值对数据进行分区,就不需要集群。
每一个接种了7种疫苗的人都会被列入名单7。
发布于 2019-11-20 10:04:47
经过大量的分析,我采用了K-模聚类算法.在此基础上,形成簇群。下面是K模式算法如何工作的视频链接.[https://www.youtube.com/watch?v=b39_vipRkUo]
https://stackoverflow.com/questions/58307043
复制相似问题