首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何限制Amazon机器学习模型的输出?(预测板球队结果)

如何限制Amazon机器学习模型的输出?(预测板球队结果)
EN

Stack Overflow用户
提问于 2017-06-15 23:19:13
回答 1查看 136关注 0票数 0

我正在尝试根据如下所示的历史数据集来预测比赛的胜利者,

数据集由国际足球联赛赛季和Team_Name_id与对手球队组成,是国际足球联赛中的球队名称。我已经将match id设置为Row id并创建了模型。运行实时测试时,结果不符合预期(如下所示)

目标设置为Match_winner_id。我是否遗漏了任何配置?请帮帮忙

EN

回答 1

Stack Overflow用户

发布于 2017-06-16 12:27:58

该模型完全正确地工作。只有两个问题:

  • 您的输入数据不是很好
  • 模型无法知道这两个团队中只有一个应该赢得

Data Quality

预测模型需要高质量的输入数据,以便对解释给定结果的模型进行逆向工程。此输入数据应包含可用于预测给定一组不同输入数据的结果的信息。

例如,在预测房价时,它需要知道郊区(类别)、卧室/卫生间/停车位的数量、楼龄和销售价格。然后,它可以使用略有不同的变量组合来预测其他房屋的销售价格。

但是,根据您的屏幕截图,您提供了以下信息(可能更多)来进行预测:

  • Teams:不是很好,因为您正在分隔C列和D列。模型将假定它们是不相关的信息。它没有意识到这两个值可能是swapped.
  • Match Date :除非结果随时间成比例变化,否则这两个值是无用的信息(例如,一个球队不断地得到better)
  • Season:,就像比赛日期一样,这可能是无用的,因为你总是在预测未来--你不会预测过去的season
  • Venue:,只有当一个特定的球队总是在给定的venue
  • Toss决策中获胜时,你才会预测过去的season
  • Venue::,这真的会影响结果吗?而且,它只在游戏开始时才知道,所以对于预测未来的game.
  • Score:类型并不是很好:直到游戏结束你才能知道game.
  • Win类型,所以它不适合再次预测未来的win类型,直到实际的游戏才知道。所以对比赛的未来predictions.
  • Man没有好处: games.
  • Umpire:未来不为人所知裁判如何影响game?
  • City:的结果是的,考虑到主队通常具有优势。

您提供的可用于预测未来游戏的信息非常少。实际上,只有团队和场地。其他一切要么是游戏本身的一部分,要么是无关紧要的。

只选择两个团队中的一个

当ML模型查看您的数据并尝试做出预测时,它将查看您提供给的所有数据。例如,它可能会注意到,对于给定的场地和赛季,第8队有更高的获胜倾向。因此,考虑到场地和赛季,它将有利于第8队获胜。该模型没有概念,即唯一可能的结果是列C和D中给出的两支球队中的一支。

您正在预测两个给定的团队,并且在列C或列D中列出了团队,这是没有意义的-- 如果您在列之间交换团队,结果是相同的,但是模型没有这个概念。此外,关于团队1和团队2的信息与团队3和团队4完全无关。

您应该做的是为每个团队创建一个数据集,列出他们的所有比赛,外加一个显示结果的列--一个布尔值(获胜/失败)或一个表示他们获胜的跑动次数的值(其中负数表示失败)。然后,您可以要求他们建立模型来预测该团队的结果,给定输入数据,这将是输赢或高于/低于另一个团队的分数。

但从本质上讲,我认为您的输入数据没有足够丰富的内容,无法做出合理的预测。只需问问自己:“如果我想知道哪支球队会赢,我想知道什么数据?”它可能是过去的结果,天气状况,每支球队的哪些球员,他们在过去一周打了多少场比赛,等等。这些信息都不会作为输入提供给您的输入数据的每一行。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44571273

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档