我有一个数据集,有学生成绩分数(连续和因变量)、教师资格(普通和自变量包含类别:硕士、学士、高中)。我想运用回归分析的方法来检验教师资格对学生成绩的影响。
如何在应用线性回归之前对序数数据进行编码?
发布于 2020-07-29 09:53:44
我认为最好的办法是对教师资格进行虚拟编码。因此,每个级别的资格都以单独的截取项进入回归。请注意,虚拟编码总是与对比度水平相反的。因此,当“硕士学位”是基本水平时,你会看到“学士”与“硕士”等相比的效果。
您可以使用i.前缀(例如summarize i.size )在Stata中进行虚拟编码。在回归中,您将使用reg y i.x。
有关细节,请参阅斯塔塔博士。
https://datascience.stackexchange.com/questions/78464
复制相似问题