我做了一个预测足球比赛结果的项目,但结果证明这是一项非常具有挑战性的任务。我尝试了不同的模型,但我只有50-54%的准确性在我的测试数据集。有些模型是以这样一种方式创建的,即某一模型将预测一支球队是否会赢得、平局或输掉一场比赛。同样的模型还可以预测该队的对手是否会赢、平局或输掉比赛。每个模型对每个团队的预测准确率约为50%。第二组模型,我尝试,从两个队的数据组合,并预测比赛属于哪一类(主场胜利,客场胜利,平局)。在该系统中,每天只有10场比赛可供预测。也就是说,如果我用第二个模型预测这10场比赛,我就有机会正确预测5场比赛。在这个项目中,我只需要正确地预测一天内10场比赛中的3场比赛。是否有系统地知道我的模型最有可能正确预测的3场比赛?我只需要得到3个正确的预测,我通常得到5正确,但我不知道如何选择我的3个最好的匹配。
注:第一类模型使用大约50个特征进行预测,而第二类模型使用101。我试过了,他们仍然给了我50%的准确率。我仍然要建立一个系统,选择匹配的主队预测与使用第一类模型的客场预测没有矛盾。
发布于 2015-04-18 19:45:50
这听起来是个有趣的项目。我最近做了一个几乎是个案的研究。为了只得到3个最准确的预测,我想你可以按事件的概率(胜诉、平局或松散)对那些正确预测的5场比赛进行排序,然后选择前三场比赛,我希望你的模型能够给出事件的概率。我希望这会有所帮助:)
发布于 2015-05-21 08:26:42
听起来,您可以使用回归模型来估计一个团队相对于另一个团队获胜/平局/输的概率。基本上,对于任何结果(双赢、平局和输球),您都希望这样做:
P(A|B) = ...
P(B|A) = ...这意味着:如果A组的结果与B组相匹配,则结果的概率(反之亦然)。
估计数可以这样表示:
P(A > B) = 0.75 % A wins
P(A = B) = 0.10 % A draws
P(A < B) = 0.15 % A loses
P(B > A) = 0.20 % B wins
P(B = A) = 0.10 % B draws
P(B > A) = 0.70 % B loses我认为一个合乎逻辑的步骤是衡量对某一特定结果的偏见。这将代表您的算法的置信度。任何结果的概率越相似(即P(B >//< A) = 0.33),它就越没有信心。
发布于 2015-05-22 22:48:36
模型是一个随机过程。马尔可夫链是要走的路。建立一个随机矩阵,其中状态可以是A组T,...get所有可能的组合,并利用过去的数据得到赢得...and的初始概率,然后利用Xn= XiP^n的美丽性质,这里Xn是第n阶段的概率向量,Xi是初始向量,P是概率转移矩阵。
https://datascience.stackexchange.com/questions/5267
复制相似问题