我有一套数据的房价和他们相应的特点(房间,米平方等)。另一个特点是房子的出售日期。其目的是建立一个模型,可以估计一套房子的价格,就像它是今天出售的一样。例如,一套具有特定功能的房子(5间房,100米平方)和今天的日期(28-1-2020年),它会卖什么?时间是一个重要的组成部分,因为价格上涨(随着时间的推移膨胀)。我正在努力寻找一种方法,以合并销售日期作为一个功能,在梯度提升模型。
我认为有几种方法:
你对这两种选择有什么看法?有没有其他方法?
发布于 2021-08-13 14:30:16
模拟通货膨胀最常见的两种方法是间接的和直接的。
通货膨胀可以通过在模型中加入时间作为特征来建模。对时间进行编码的最有用的方法是作为一个相对月份。数据集中的第一个月可以是1,第二个月可以是2,…。。然后,该模型可以捕捉月增长对价格的影响。
通货膨胀可以是直接的模型。该模型可以预测特定时间的价格,然后取模型的估计价格,并将其乘以一个查找的通货膨胀量来调整其今天的美元价值。
发布于 2022-06-07 01:50:11
这是一个引入单独数据集的好地方,特别是如果您的数据只跨越一段很短的时间。
另一个传统上更正确但现在就不那么正确的选择是假设住房通货膨胀率是线性的和单调的(例如过去40年的3%/年)。
我还想补充的是,如果你更长期地寻找一个更现实的模型,你将需要将利率(最低限度)作为一个功能。但其他事情,如人口增长和首次拥有权,将是很容易补充的。
https://datascience.stackexchange.com/questions/88519
复制相似问题