我正在使用纬度和经度以及陆地卫星数据作为我的随机森林模型的预报器,该模型旨在预测景观中是否有黑云杉树。纬度显示为具有很高的重要性,您可以在地图预测中看到锐利的纬度线的影响。此外,使用tunerF,mtry仅针对2个预测器进行了优化,纬度是其中之一。我的模型不合适吗?
发布于 2016-01-27 19:31:35
选择mtry=2,并不意味着您完全放弃了第三个参数。事实上,情况正好相反。首先,您应该在RF模型的训练中包含所有合理的预测值。降低mtry将允许在每个节点中测试少于所有变量的变量。这使得不太重要的变量对最终预测的贡献更大。Low mtry有点类似于岭(正则化)回归。正则化增加了偏差,但降低了方差。有时粗暴和健壮只是更好,有时不是。你可以通过交叉验证来知道。
听起来你有大约500个样本(很多),而只有3-6个变量(很少)。我会从lazy开始,只需手动将mtry更改为所有3-6个值,然后查看返回的OOB-Cv值。
https://stackoverflow.com/questions/35027439
复制相似问题