我正在研究传球和跑动对几个足球赛季伤病的影响。通过收集数据的方式,所有的受伤都被记录下来,以及关于受伤发生的比赛的信息(即位置,季度,比赛类型),比赛信息(例如天气条件,比赛场地等),以及团队信息(即比赛中传球与跑动的次数)。
我想使用一场比赛作为主要曝光,结果是受伤与非受伤,并使用逻辑回归进行分析,但要做到这一点,我需要创建所有没有受伤的记录。对于一支球队来说,在一场比赛中有从0到大约6-7次受伤的范围,并且总的传球和跑动比赛都会被记录下来,所以我需要找到一种方法来添加X(总传球次数减去传球比赛中的受伤次数)和Y(总跑动次数-跑动比赛中的受伤次数)记录,这些记录共享了该特定比赛的所有细节,但没有受伤作为结果。我想在proc sql中有一种方法可以做到这一点,但我在网上找不到它。我该如何开始编码呢?
我附上了一个相关数据的例子。我需要做的一个例子是,对于第一场比赛,添加30个传球记录和38个跑动比赛记录,没有受伤的结果,以及其他相同的数据(球队A,干燥天气,比赛)。

发布于 2020-07-27 21:21:16
您可以使用freq语句来避免对其进行解聚。
FREQ语句标识一个变量,该变量包含每个观察值的出现频率。PROC逻辑将每个观察值视为出现n次,其中n是观察值的FREQ变量的值。如果不是整数,则将频率值截断为整数。
解聚数据将需要数据步骤和do循环。不推荐这样做。
https://stackoverflow.com/questions/63113951
复制相似问题