我有一些数据供不同的客户选择一个'n‘产品或没有产品。我对每个客户都有一些有用的特性。我可以用这些数据建立一个多类分类问题,并使用一个分类模型(例如随机森林)来学习数据。然后,该模型将输出以下类别之一:
0,1,2.,n
其中1,2,.,n是第1,2等产品,0是当客户选择不购买任何东西时。我想把这个模型作为一个推荐系统,也就是说,当一个新客户(连同所有其他功能)出现时,我知道他会更有可能购买哪种n种产品。
问题是:在上面的设置中,当模型为新客户输出“0”时,我不知道该做什么。在这种情况下,即新客户不可能购买任何产品时,我应该采取什么行动?还是我应该用其他方式来描述分类问题呢?难道我们根本不应该把这个问题描述成分类问题吗?
发布于 2019-01-30 20:24:24
一种选择可以是对输出的建模略有不同。在没有乘积的情况下,不返回乘积1、2、.、n或0的类型,也许您可以返回对的列表( (product, probability) ),如果最大的概率是对应于0的概率,即“没有乘积”,您只需要推荐第二个最好的。
这种方法的一个优点是,您可以推荐多个产品,可能是前3名,或者是概率高于特定阈值的产品列表,等等。
如果客户是新来的,并且没有您可以根据的信息,也许您可以向类似的客户推荐您将提供的产品(如果您可以以任何方式将客户聚集在一起)或简单地推荐最畅销的产品。
发布于 2019-01-30 20:40:36
我以前遇到过这个问题,我所做的就是利用这个机会向客户提供一个随机的产品。从字面上说,做一个随机的选择,让这是一个推荐给客户。
为什么要这么做?因为您的客户拥有一个新的/唯一的“配置文件”,这使他们成为一个值得学习的宝贵数据点。所以继续向他们展示一份随机的物品列表,看看到底是什么。在数据库中将这些客户记录标记为特殊记录,然后立即将它们反馈到算法中以供将来的建议使用。这些数据在你的强化学习周期中非常有价值(你在做强化,不是吗?)可以帮助你的算法随着时间的推移变得更聪明。
https://datascience.stackexchange.com/questions/44831
复制相似问题