我在研究泰坦尼克号的数据集。到目前为止,通过logistic回归和随机森林的软多数投票,我提交的申请得分为0.78分。至于功能,我用的是Pclass,Age,SibSp,Parch,Fare,the,登船。
我的问题是如何进一步提高这个分类问题的分数?
我试过的一件事是为多数票增加更多的分类器,但这没有帮助,它甚至值得投票结果。我如何理解这种值得的效果?
谢谢你的洞察力。
发布于 2016-08-02 02:52:09
大问题。
好的,如果我是你,这里有几件事我会看的..
R #1 (我最喜欢)
R #2
Python #1
...Hopefully,这很有帮助
发布于 2016-08-05 07:35:54
好吧,我现在在0.81340的比赛中。我只会清理掉某些东西。我建议您在使用集成方法之前尝试特性工程。正如前面提到的,实际上有一个相当不错的教程。实际上,仅仅依靠特性工程和十倍交叉验证的RandomForest,就可以得到至少0.82的分数。某些需要你思考的事情:
都是最好的。
干杯。
https://datascience.stackexchange.com/questions/13104
复制相似问题