运用logistic回归分析,我试图模拟女性和收入低于贫困线(两个二元变量)对预测高血压发病概率的边际效应。我创建了一个交互术语(poverty_FEMALE)来尝试建模,但我不确定我对系数的解释是否正确。
是否正确地说:
处于阈值以下的
。
如果是这样的话,为什么贫穷和女性的风险较低,而这两个变量的系数本身就是我们的正值?
pov_FEMALE=(df$BELOW_100_POVERTY*(df$FEMALE))
Marginal Effects:
dF/dx Std. Err. z P>|z|
BELOW_100_POVERTY 0.0670417 0.0243266 2.7559 0.0058531 **
FEMALE 0.0410705 0.0172280 2.3839 0.0171283 *
pov_FEMALE -0.0553485 0.0160284 -3.4531 0.0005541 ***发布于 2020-10-02 21:24:12
假设dF/dx显示出你想要的边际效应类型,
低于阈值(0.067)和男性(0)的
。
女性(0.041)和非贫困(0)的边际效应是:0.041
女性( 0.041 )、贫困( 0.067 )和共同条件(-0.055)的边际效应为:0.041+0.067 -.055
想想偏导数的含义。直接效应和相互作用效应是加性的,因为你取对变量x的估计方程的偏导数。
假设您描述的变量是指示符(值中的1或0),则基值的边际效应(值0,例如“男性”)与截距没有区别。人们只能将结果解释为基线概率加上边际效应,在这种情况下,基线被定义为男性和非穷人。
https://stackoverflow.com/questions/64161376
复制相似问题