首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用可伸缩的方式将具有相似标题的用户分组

用可伸缩的方式将具有相似标题的用户分组
EN

Data Science用户
提问于 2020-05-19 12:04:04
回答 2查看 50关注 0票数 0

我试图找出最好的方法,根据顾客的购物车结账项目分组。我有篮子,篮子里有什么,但是我完全不知道如何分组所有类似的篮子。我有一组用户,我认为不应该被计算在我的总体指标中(或者至少承认他们)。这些用户创建一个新帐户,将4-5项放在他们的购物车中,并结帐。然后创建一个新帐户,并重复该过程。他们似乎重复这个过程长达12个小时,然后改变项目,我想分组这些客户与“常规”客户。

我的问题是,它并不总是相同的4-5项--我不知道如何扩大搜索范围。如果我知道是Item1-Item5,这将是一个简单的搜索,甚至比较每个人的手推车,但把每个人的手推车和其他人的手推车进行比较,似乎根本不会扩展。(如果我想要5个标题的话,我也想要‘边缘’,但他们有4个,或者所有的5个和一个新的,等等)。

我对此非常陌生,甚至我应该搜索哪些术语,或者我应该学习哪些软件包,我都会非常感激。

EN

回答 2

Data Science用户

发布于 2020-05-19 23:00:25

这个问题似乎有点类似于推荐系统问题,如果我正确理解的话,在这个问题中,您有几个标题要根据用户以前的交互情况推荐给他们。

也许你能在上面读到?您可以搜索诸如矩阵分解/协作筛选之类的算法。

一个很好的资源:https://course.fast.ai/videos/?lesson=4

票数 0
EN

Data Science用户

发布于 2020-06-19 08:36:53

如果您想根据某些特性(这里是签出历史记录)将数据集分组为k个不同的组,则可以使用K均值聚类算法将它们聚为不同的组。您会发现sklearn k表示聚类模块很有帮助。您所需要做的就是将数据提供到其中,并选择适当的超参数。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/74456

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档