我在一家企业对企业的公司工作,该公司拥有一个大型的现有客户(小型企业)数据库,其中包含描述每个客户的各种数据列(例如,行业、信誉、财务数据等)。我知道有几家营销数据供应商维护着小型企业数据库,它们的数据列与我的公司类似。
问:使用我的公司已经拥有的数据,我如何才能确定哪些客户在供应商的数据库中有最大的潜力成为一个客户,如果营销的话?我应该建立一个预测模型吗?我应该做某种聚类吗?
发布于 2017-03-23 17:54:11
问题是,您只有积极的实例(已经成为客户的企业),而没有消极的实例(尚未成为客户的企业)。这防止了监督学习的使用。你可以尝试无监督的学习--例如,一种分类器--但我不认为它会特别有效。
如果你有关于你试图接近的企业的数据,但最终没有成为你的客户,那么你可以尝试应用监督学习。
发布于 2017-02-12 03:47:40
我认为您的问题非常适合决策树分类。我链接到的演示文稿将为您提供一个很好的概述,以了解决策树模型。
这个Python教程将教会您如何从头开始构建自己的决策树模型。有了这些知识,通过在线搜索更多的决策树示例,我相信您会发现自己处于一个好位置!
https://datascience.stackexchange.com/questions/16902
复制相似问题