我的预测模型使用了RandomForestClassifier。但是打印的输出要么是0,要么是小数。我需要做什么,我的模型,以显示给我0和1's,而不是小数?
注意:使用特性重要性和删除最不重要的列,但精度是相同的,输出没有太大的变化。
另外,我的估计数等于1000。我是增加还是减少?
edit:
target col
1
0
0
1
output col
0.994
0
0.355
0.768如果你看了这篇文章,谢谢你!
发布于 2022-06-04 15:26:22
取模型给出的数字和阈值。X上面的所有东西(通常是.5)都映射到0,大于X的所有东西都映射到1。
发布于 2022-06-04 16:01:00
你在对什么数据进行培训?你的训练数据是二进制的吗?
如果没有,则在目标变量应为1和0时设置treshold。然后在二进制标签上训练你的RandomForestClassifier。可能是你在连续的目标变量上训练你的分类器,这就是为什么你的表现如此糟糕的原因。
森林的泛化误差收敛于a.s.随着森林中树木数量的增加而达到极限(Breiman,2001)
更多的树=更好。然而,它在计算上也更昂贵。这是一种权衡。启动低到64棵树,然后继续工作,如果泛化错误仍然很高的话。
https://datascience.stackexchange.com/questions/111563
复制相似问题