首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >学生入学概率预测模型的建立问题

学生入学概率预测模型的建立问题
EN

Data Science用户
提问于 2019-04-20 09:06:55
回答 1查看 42关注 0票数 2

我正试图建立一个模型来预测俄罗斯教育系统中学生入学的概率。每个学校的科目都有考试。这个学生可以拿几张。根据考试结果,学生可以进入一些教师(如化学,计算机科学,经济学,政治学)。

我用科学工具-学习建立模型。我尝试了朴素贝叶斯,随机森林和另一个分类估计,但没有太大的差别。我使用predict_proba方法获取概率,并以每一次考试的分数作为特征,以教员为目标(教师被视为班级)。

主要的问题是,当增加更多的参加考试,教员的概率降低,而它应该增加或不改变。

我的猜测是,这种模式给出的学生最受欢迎的学院有这样的分数,而不是录取的可能性。我能做些什么来改进模型吗?

EN

回答 1

Data Science用户

发布于 2019-04-22 13:56:33

确保您以正确的方式对Y数据建模。

我能想到为什么你会有这么奇怪的结果:

  • 您正在为所有学生和所有学院建立二进制的“是”/“否”答案,确保您只考虑到提交给给定教师的学生(其中一些通过了,而有些没有),而不是所有的学生。
  • 有时候,更多的考试会给你的答案增加噪音,因为这些专业人员会寻找那些在寻找答案方面表现优于他们的专业人员,这意味着你会发现其他的结果是答案的“噪音”。
票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/49629

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档