我有一个多年来访问商店的管理数据集,我正试图合并到ID变量下的一个数据集中。
每个数据集都有一个ID的副本,该副本发生在不同的商店访问期间,由Date注释。一些较新的数据文件还没有包含在旧数据文件中的新变量(Y)。不同年份的数据集也将包含不同ID所指示的不同案例。另外,有些变量在每个情况下可能是相同的,但在不同的日期。我希望合并的文件保留这些副本。
示例数据文件:
档案1
ID Date X
1 3 4
1 5 3
2 1 4档案2
ID Date X Y
1 6 4 2
1 7 1 5
2 8 4 7
3 7 2 3我希望合并后的文件继续列出所有重复的情况,如下所示:
ID Date X Y
1 3 4 .
1 5 3 .
1 6 4 2
1 7 1 5
2 1 4 .
2 8 4 7
3 7 2 3然后,我计划重组(CASESTOVARS /AUTOFIX=0)合并的文件,使其看起来如下:
ID Date.1 Date.2 Date.3 Date.4 X.1 X.2 X.3 X.4 Y.1 Y.2 Y.3 Y.4
1 3 5 6 7 4 3 4 1 . . 2 5
2 1 8 . . 4 4 . . . 7 . .
3 7 . . . 2 . . . 3 . . .不过,我在最初的合并过程中遇到了问题。当文件都有重复的情况时,我尝试查找最安全的合并方法,以确保在过程中不会丢失任何数据。似乎“添加变量”方法会导致重复变量的值丢失。
谢谢!
编辑:如果我使用“添加变量”函数,同时使用ID和Date变量作为关键变量,这会有助于避免重复情况的删除吗?
发布于 2017-02-20 20:41:06
为什么不试试add cases而不是add variables呢?如果没有出现相同日期的相同Id,那么它应该可以在casestovars中正常工作。
如果存在这种情况,那么在继续使用casestovars之前,您需要考虑如何处理它们。
一种方法是按ID和日期进行聚合,并决定是否要将这种情况下的数据vars相加。
https://stackoverflow.com/questions/42352398
复制相似问题