在xgboost的文档中,我读到:
base_score default=0.5 :所有实例的初始预测分数,全局偏差
这句话的意思是什么?基得分是否是数据集中感兴趣事件的先验概率?也就是说,在有300个正数和700个负数的1,000个观测数据中,基本分数是0.3?
如果不是,那会是什么呢?
您的建议将不胜感激。
发布于 2018-03-20 20:27:28
我认为你的理解是正确的,在你的例子中,基本分数可以设置为0.3,或者你可以简单地把它设为默认的0.5。对于高度不平衡的数据,您可以将其初始化为更有意义的基础分数,以改进学习过程。理论上,只要你选择正确的学习速度并给它足够的训练步骤,起跑线得分就不会影响结果。看看作者在本期中的答案。
https://stackoverflow.com/questions/47596486
复制相似问题