如果我有很多数据点描述一辆二手车的价格。我将如何找到汽车的市场价值(假设数据集中的价格点是使用的唯一决定因素,并且确定的基础将是该特定汽车出现的频率频率越高越好价格数据点)。
绝对值递归的计数将不起作用,因为我希望将类似的数字(低于总价格的5%的差异)分类为一个类别。
发布于 2018-01-02 05:23:57
从你的问题中还不清楚,你是否试图预测许多二手车的价值取决于不同的车辆特性(如车龄、车型、里程)或预测一辆汽车的价格。
假设前者(使用变量的预测),您可以将其设置为一个回归问题,其中价格是因变量,(年龄、模型、里程)是自变量。谷歌“波士顿房价预测”是一个类似于不同领域的应用。
如果您只有价格数据(忽略车辆特性),您正在寻找汇总统计数据。你可以从平均价格或中间价格开始。然后,通过将价格建模为一些合理的统计分布(正态分布或泊松分布),然后将关于分布的典型汇总统计作为估计值(例如分位数之间的范围),就可以使情况更加复杂。
https://datascience.stackexchange.com/questions/26185
复制相似问题