有一个名为numer.ai的数据挖掘竞赛网站。
据推测,该网站背后是一家对冲基金,它利用人们发送的预测。排名第100位的人不断赚钱,直到下一个数据集揭晓,竞争才重新开始。
我不明白的是,像Kaggle这样的网站通过有一个公共和一个私人的领导板来避免过度适应。私人领奖板只在比赛结束时公布,然后才颁发奖品。
Numerai在规则下说,它使用的是同样的方法。引用:
如果模型超过了公共领导板,并且在私人领导板上表现不佳,那么这些用户将遭受潜在的惩罚,从而消除所有收益。这不鼓励过度适应。
他们所说的“罚则”是甚麽意思?我认识一个在那个网站上赚钱的人,他不断地扮演公众领袖的角色。这是否意味着,如果他不收回比特币,他就有可能失去自己赚来的钱,以防他身体不适?
发布于 2016-06-21 10:46:01
我在他们博客的评论部分上找到了答案:
在公开得分排行榜上列出的收益是潜在的赢家。实际中奖由个人得分排行榜决定.在退出的时候,当新的数据集被发布时,你的实际收益将被透露给你。
https://datascience.stackexchange.com/questions/12202
复制相似问题