我试图找出最好的方法,根据顾客的购物车结账项目分组。我有篮子,篮子里有什么,但是我完全不知道如何分组所有类似的篮子。我有一组用户,我认为不应该被计算在我的总体指标中(或者至少承认他们)。这些用户创建一个新帐户,将4-5项放在他们的购物车中,并结帐。然后创建一个新帐户,并重复该过程。他们似乎重复这个过程长达12个小时,然后改变项目,我想分组这些客户与“常规”客户。
我的问题是,它并不总是相同的4-5项--我不知道如何扩大搜索范围。如果我知道是Item1-Item5,这将是一个简单的搜索,甚至比较每个人的手推车,但把每个人的手推车和其他人的手推车进行比较,似乎根本不会扩展。(如果我想要5个标题的话,我也想要‘边缘’,但他们有4个,或者所有的5个和一个新的,等等)。
我对此非常陌生,甚至我应该搜索哪些术语,或者我应该学习哪些软件包,我都会非常感激。
发布于 2020-05-19 23:00:25
这个问题似乎有点类似于推荐系统问题,如果我正确理解的话,在这个问题中,您有几个标题要根据用户以前的交互情况推荐给他们。
也许你能在上面读到?您可以搜索诸如矩阵分解/协作筛选之类的算法。
发布于 2020-06-19 08:36:53
如果您想根据某些特性(这里是签出历史记录)将数据集分组为k个不同的组,则可以使用K均值聚类算法将它们聚为不同的组。您会发现sklearn k表示聚类模块很有帮助。您所需要做的就是将数据提供到其中,并选择适当的超参数。
https://datascience.stackexchange.com/questions/74456
复制相似问题