假设我有一个包含变量的大数据集,包括但不限于贷款的开始/结束日期、贷款的名义金额、贷款预付指标等。
我的目标是创建一个关于过去数据的模型,以便预测当前贷款的提前还款日期,我想知道哪种ML方法最适合这种情况。我的第一个想法是将此问题作为分类问题来处理,使用间隔日期来预测提前付款日期间隔,但我认为应该有一种更健壮和复杂的方法来解决这个问题。
发布于 2019-09-24 10:58:13
您可以在这里使用回归模型和分类模型。此外,我建议在使用除决策树模型之外的算法时,日志转换您的财务特性(例如:债务、最后的信用风险、平均贷款额等)(因为它们不受单调转换的影响)。
您可以构建一个模型来预测客户是否会在付款日之后支付"x“天。在这个模型中,您需要通过比较不同x天模型的结果来找到最佳的"x“。此外,您需要找到最优置信范围在每一个模型比较。
在此设置中,您将预测客户在付款日期后将支付多少天。再次,您应该获得信任间隔,以便您计算3天的客户,这意味着她将支付3天后(这可能是更早的负面预测)。然而,您知道,您的模型是强大的+2-2天间隔。那么您应该说,这个特定的客户将在付款日期后1或5天内付款。
我建议使用xgboost,lightgbm和RNNs。但它不太清楚,也许你有一个线性空间,它与支持向量机,线拟合等快速收敛。然而,他们是相当好的,卡格尔优胜者学习者。
希望能帮上忙。我认为这将是一个很好的起点。
https://datascience.stackexchange.com/questions/60679
复制相似问题