我有一个案例研究,其中目标变量(一个单一因素)通过多个项目来衡量。这些项目用5-Likert量表来衡量(从不,很少,有时,经常,经常,总是)
由于为因变量调用了多个项,所以我计算了每个对象的平均值。然后应用线性回归。这是正确的方式吗?还是有更好的方法来处理?
发布于 2022-10-05 04:09:46
这是一个很重要的问题,有一个很长的答案,最终你会做出一些决定,在你决定什么是对还是什么是错之前,做更多的研究。
第一件事,你有一个6级的利克特量表,你说5它确实有点重要的解释(你将需要做一些研究)。
第二:
由于为因变量调用了多个项,所以我计算了每个对象的平均值。
不确定你是在计算每个接受调查的人的平均值(将答案转换成数值),还是对所有受访者的每一项计算平均值。
所以我要给我两分钱:
你的等级是顺序的还是间隔的,它们有顺序和等级,但是你真的能量化“很少”和“有时”之间的距离吗?这是你必须决定的,它看起来你要去的间隔。
无论哪种方法,我都会谨慎地使用您计算出来的值,因为量表上的所有项目都贡献给了一个变量,因此每个人都有一个得分(如果使用数字值),并且它是所有项目的所有点数的总和。这是由该人的比例表示的变量的值。
要获得整个调查样本的平均值,您可以使用
区间分析:如果你觉得你可以把它当作区间数据,你可以使用数值1-6,对于每个人回答你的调查中的每一个项目。你把所有物品的总价值加起来,这是这个人这个比例问题的利克特分数。
然后,您可以进行描述性分析,查看分数的分布(绘制直方图并计算平均值、标准差和分位数),用于比较您测试的相对于其他测试的人的水平。
如果你知道个人的具体情况(除了利克特的调查地址外),你可以用皮尔逊的相关性检验,用每个被调查者的行和,在男女或年龄组或政党之间进行比较。
如果你认为你不能安全地在你的等级之间建立一个有意义的、一致的、可量化的空间,那么你就需要把分析看作是有序的。因此,你的分析有点不同。
描述性工作包括为每个项目构建“直方图”(实际上是一个条形图),确定最常见的响应(模式),并查看每个项是如何分布的。
记住,你试图用所有的项目来回答一个问题,所以比较答案在各个项目中的分布可能是有意义的。尽管试图阐明一个潜在的变量质量,但它们不是以同样的方式发展吗?
同样,如果你对被调查的人有所了解(一个观点,从属关系,性别等等),你可以用X-平方来评估项目的反应是否与已知的因素有关。
如果你有一个明确的目标,比如“某人很可能是杂食性或素食主义者”,而你有一项结构良好的likert调查,并且知道每个被调查者是杂食性还是素食主义者,以及饮食习惯不明的人的调查,那么你可能会使用逻辑回归。
您确实需要根据您想要理解或预测的内容,根据您的Likert项来选择模型或测试。在创建项目和寻找应答者之前,最好先设计分析。这样,你会更体贴,得到更一致的结果。
https://datascience.stackexchange.com/questions/114894
复制相似问题