首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何进一步提高kaggle泰坦尼克号的提交精度?

如何进一步提高kaggle泰坦尼克号的提交精度?
EN

Data Science用户
提问于 2016-07-30 13:15:15
回答 2查看 6.2K关注 0票数 4

我在研究泰坦尼克号的数据集。到目前为止,通过logistic回归和随机森林的软多数投票,我提交的申请得分为0.78分。至于功能,我用的是Pclass,Age,SibSp,Parch,Fare,the,登船。

我的问题是如何进一步提高这个分类问题的分数?

我试过的一件事是为多数票增加更多的分类器,但这没有帮助,它甚至值得投票结果。我如何理解这种值得的效果?

谢谢你的洞察力。

EN

回答 2

Data Science用户

回答已采纳

发布于 2016-08-02 02:52:09

大问题。

好的,如果我是你,这里有几件事我会看的..

  1. 你试过什么功能工程吗?(听起来你只是在训练中使用了这些特性,但我不能100%)
  2. 随机森林应该做得很好,但也可能尝试xgboost吗?它对卡格尔的一切都很在行。如果你在考虑堆叠/集合,支持向量机也值得一试。
  3. 看看关于这场比赛的一些教程。他们有数百人,而且大多数人都很棒。

链接:

R #1 (我最喜欢)

R #2

Python #1

Python #2

...Hopefully,这很有帮助

票数 5
EN

Data Science用户

发布于 2016-08-05 07:35:54

好吧,我现在在0.81340的比赛中。我只会清理掉某些东西。我建议您在使用集成方法之前尝试特性工程。正如前面提到的,实际上有一个相当不错的教程。实际上,仅仅依靠特性工程和十倍交叉验证的RandomForest,就可以得到至少0.82的分数。某些需要你思考的事情:

  • 看看这个时代,它还能给你什么其他信息。
  • SibSp和Parch实际上代表着不同的东西吗?
  • 你能从乘客的名字里拿点什么吗?

都是最好的。

干杯。

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/13104

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档