文章/答案/技术大牛

发布

社区首页 >问答首页 >如何进一步提高kaggle泰坦尼克号的提交精度？

问如何进一步提高kaggle泰坦尼克号的提交精度？
EN

Data Science用户

提问于 2016-07-30 13:15:15

回答 2查看 6.2K关注 0票数 4

我在研究泰坦尼克号的数据集。到目前为止，通过logistic回归和随机森林的软多数投票，我提交的申请得分为0.78分。至于功能，我用的是Pclass，Age，SibSp，Parch，Fare，the，登船。

我的问题是如何进一步提高这个分类问题的分数？

我试过的一件事是为多数票增加更多的分类器，但这没有帮助，它甚至值得投票结果。我如何理解这种值得的效果？

谢谢你的洞察力。

machine-learning

classification

beginner

回答 2

Data Science用户

回答已采纳

发布于 2016-08-02 02:52:09

大问题。

好的，如果我是你，这里有几件事我会看的..

你试过什么功能工程吗？(听起来你只是在训练中使用了这些特性，但我不能100%)
随机森林应该做得很好，但也可能尝试xgboost吗？它对卡格尔的一切都很在行。如果你在考虑堆叠/集合，支持向量机也值得一试。
看看关于这场比赛的一些教程。他们有数百人，而且大多数人都很棒。

链接：

R #1 (我最喜欢)

R #2

Python #1

Python #2

...Hopefully，这很有帮助

票数 5

Data Science用户

发布于 2016-08-05 07:35:54

好吧，我现在在0.81340的比赛中。我只会清理掉某些东西。我建议您在使用集成方法之前尝试特性工程。正如前面提到的，实际上有一个相当不错的教程。实际上，仅仅依靠特性工程和十倍交叉验证的RandomForest，就可以得到至少0.82的分数。某些需要你思考的事情：

看看这个时代，它还能给你什么其他信息。
SibSp和Parch实际上代表着不同的东西吗？
你能从乘客的名字里拿点什么吗？

都是最好的。

干杯。

票数 3

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/13104

复制

相似问题

问如何进一步提高kaggle泰坦尼克号的提交精度？
EN

回答 2

Data Science用户

链接：

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何进一步提高kaggle泰坦尼克号的提交精度？EN

回答 2

Data Science用户

链接：

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何进一步提高kaggle泰坦尼克号的提交精度？
EN