我正在研究某一行业的收入增长率在收入分配的不同部分是否存在显著差异,以确定收入差距是否正在显著拉大或缩小。
QUANTREG模型
我在SPSS中做了分位数回归(我刚开始编码,只有Python的基本知识,所以我需要你的帮助)。因变量是指数化收入,自变量是时间(这个数据集中的季度),人口统计学组,职业部门。我还添加了每个虚拟人的交互条件和时间变量。
因此(至少在我看来),这个模型允许在三个层次上比较收入的变化:
(例如,与数据输入工作相比:数据分析增加了100欧元,数据科学增加了200欧元)time*data_scientist系数在90%Q中比在10%Q中大得多,这表明高收入数据科学家的收入随着时间的推移比低收入数据科学家()有更大的增长。
发问
因此,我在SPSS上得到了这个分位数回归的结果,这是一个包含所有系数及其重要性和置信区间的巨大表格。
现在我想弄清楚90%Q和10%Q之间的差异是否具有统计学意义,以说明这一行业的收入差距是否显著增加或缩小。我想用Python代替SPSS,我搜索了如何将数据分割成分位数,以及如何进行分位数回归。但是我们应该如何去测试90%Q和10%Q之间差异的意义呢?
发布于 2021-01-20 22:54:57
我发现了一种方法来检验回归系数是否有显着性差异,50%规则的使用标准化的β权值及其95%的置信区间(这可以通过偏差修正的自举来估计;对于分位数回归,它们通常已经提供在输出中)。该规则基本规定,如果两个样本均值的95%置信区间重叠小于50%,则存在显着性差异(p=0.05)。当重叠小于14%时,显着性水平在p=0.01。
这是我在Youtube上找到这种方法的视频:
https://www.youtube.com/watch?v=qKnpiGwNDMk
Youtube视频中提到的那份文件:
Cumming,G. (2009)。用眼睛推断:读取置信区间的重叠。医学统计,28(2),205-220。
https://stackoverflow.com/questions/65540125
复制相似问题