我随机问了一些人以下问题:“你多久吸烟一次?”答案类别如下: 1.每天2.偶尔或3.从不。我有受访者的详细信息,如年龄和性别。
结果如下:
10%的受访者每天吸烟。5%的人偶尔吸烟。85%的人从不吸烟。
我的问题是:
有没有可能计算这些分类数据的置信区间?也就是说,10%的受访者每天吸烟,CI=降低8%,Ci=12%上升8%。
我正在使用R、SAS和python来研究这一点。
我已经编写了以下SAS代码:
proc freq data=smoking_data;
tables smoke / binomial(level='1'); /*Daily*/
tables smoke / binomial(level='2'); /*Occasionally*/
tables smoke / binomial(level='3'); /*Never*/
run;这似乎是有效的,但我不确定二项式是否正确地用于分类数据。
提前感谢您的帮助
发布于 2020-03-30 09:01:27
我会把它叫做序数变量,但是你所做的看起来很好。有一个比我在这里写的更好的解释:
https://stackoverflow.com/questions/60739748
复制相似问题