某些类型的数据集只是没有预见性?
我现在的一个现实生活例子是:我的目标是为交叉销售保险产品建立一个预测模型。例如汽车保险到健康保险。
我的数据集主要由特征数据组成,如他们所处的状态、年龄、性别、汽车类型等。
我尝试过各种不同的模型,比如XGboosted树来规范逻辑回归,而AUC无法超越.65。
因此,这导致我-某些类型的数据集只是没有预见性?你如何帮助利益相关者理解这一点?
发布于 2017-12-11 16:39:19
有些数据集可能不是很有预见性。特别是如果你缺少的变量占了方差的很大一部分。如果不与主题专家交谈,很难说是否是这样的情况。尽管如此,模型是好的和好的,但我也会确保您花费大量的时间工程功能。通常,表示数据的时间--正确的方式--可能是工作模型和坏模型之间的区别,特别是在树模型中。
https://stackoverflow.com/questions/47745988
复制相似问题