我有一个由产品、客户、价格政策、折扣、数量和净销售额组成的数据集。企业用词的任务是数量与价格。我在查看数据集时注意到了以下几点:
因为在这一点上,我认为没有任何逻辑背后的折扣是如何决定的客户。因此,从字面上说,这对净销售额和价格变化没有影响。
我该怎么做呢?这甚至是一个机器学习问题,因为变量之间根本没有因果关系。如果不是价格和需求,那么我还能向企业提出什么建议呢?
编辑: 1.产品-客户散点图UNITARY_NET_SALES与数量

图中的第一栏显示,在不同的净销售额中,产品的需求量是相同的。所以这里没有价格和需求效应。

Price_list和折扣有着相同的行为。因此,每当企业提高价格时,他们也会增加折扣,因此对净销售额的整体影响是零的。数量只是按季节规律变化。
Describe on the columns
75%的数量小于8个单位!
谢谢!
发布于 2020-07-09 16:41:33
在过去的两年里,我一直在纠结于建模定价系统,其中一个关键的知识适用于此:
可用的销售数据往往是直接预测任务的糟糕基础,其原因相当简单:
如果您将所有价格(或某一给定产品的交易价格x)划分为“接受”和“不接受”,您将意识到客户提供的数据只包含“接受”价格的实例。
因此,
然而,有几种方法可以解决这一问题。在我的评论中,我提到折扣是一个有价值的信息!
你已经注意到折扣并不取决于逻辑变量,它们看起来是随机的,这不是真的!
在大多数组织中,折扣是非常、非常灵活的,而且往往是根据谈判手工使用的。这意味着它们是我们的目标y“接受”/“不接受”的一个很好的指标。
考虑到这一点:
这意味着大幅折扣意味着对未打折价格的需求是低/负,而折扣低则表示需求很高。
要真正发现这种关系,您可能需要对相互依赖的因素进行建模,然后通过对残差方面的新模型进行培训来消除它们。
编辑:
一个重要的东西要添加,特别是对于B2B域。对某一产品的需求对客户来说几乎是一成不变的。与消费者不同的是,由于价格原因,公司不会购买过剩产品或不购买产品。
他们所做的就是交换供应商!这意味着有一个非常重要的未知变量“客户对产品的需求”。您不希望对这个变量建模,但是需要它来建模您实际想要做的事情:
您的公司满足的钱包份额或固定客户需求的百分比,其目标是确定能优化该百分比的价格。记住这一点很有帮助,因为它限制了任何模型的性能,因为您永远不知道数据中的历史需求是否已经是总需求的0%或100%,因此无论价格如何,都不会减少/增加。
https://datascience.stackexchange.com/questions/77397
复制相似问题