我需要一个分层的随机样本,由一个确定的地址数组成。我的分层变量是邮政编码。样本大小已经预先确定,并且每个邮政编码有不同的观察数。我如何将所需的每一个邮政编码的ob值合并起来?用PROC SURVEYSELECT可以做到这一点吗?我的样本大小在一个外部文件中。
示例:
邮政编码NUMBER_OBSERVATIONS
9999 10
8888 15
7777 10
6666 5
有可能吗?我该怎么做?谢谢
发布于 2021-06-24 23:06:57
使用sampsize选项并指定数据集。它将把所有的样本限制在每个地层的大小上。
proc surveyselect data = have
out = want
sampsize=external
;
strata zip;
size number_observations;
run;https://stackoverflow.com/questions/68123478
复制相似问题