我正试图建立一个模型来预测俄罗斯教育系统中学生入学的概率。每个学校的科目都有考试。这个学生可以拿几张。根据考试结果,学生可以进入一些教师(如化学,计算机科学,经济学,政治学)。
我用科学工具-学习建立模型。我尝试了朴素贝叶斯,随机森林和另一个分类估计,但没有太大的差别。我使用predict_proba方法获取概率,并以每一次考试的分数作为特征,以教员为目标(教师被视为班级)。
主要的问题是,当增加更多的参加考试,教员的概率降低,而它应该增加或不改变。
我的猜测是,这种模式给出的学生最受欢迎的学院有这样的分数,而不是录取的可能性。我能做些什么来改进模型吗?
发布于 2019-04-22 13:56:33
确保您以正确的方式对Y数据建模。
我能想到为什么你会有这么奇怪的结果:
https://datascience.stackexchange.com/questions/49629
复制相似问题