我正在处理以下数据:
我试图计算A_PDE、B_PDE、C_PDE、D_PDE每一个频道的影响。但是,由于大多数记录都是Sales = 0,而且我的模型预测这些记录的销量为非零,所以我的R^2值非常低。我怎么才能解决这个问题?我不认为从模型中删除零销售记录是正确的。
发布于 2019-05-11 08:11:07
基于维度约简的答案:您应该考虑降低数据集的维度。有多种降低数据集维数的方法。
基于回归方法的答案:另一种不降低维度的方法是使用加权最小二乘回归,如果你真的想要更准确地预测它们,那么对销售使用更高的权重。如果您的数据高度非线性,您也可以考虑使用非线性回归来捕捉您的模型的非线性。
https://datascience.stackexchange.com/questions/51776
复制相似问题