我有一个庞大的流行病学数据集,包含有病理报告和临床信息的登记数据。为了从一个文件中获取所有信息,我将多个文件合并到一个主文件中。每个病人都有一个唯一的身份证号码。每个病人都可以有几个报告,因此相同的ID号可以在ID列中重复几次。对于每一个ID条目=新行(=病理学或临床报告),都有报告样本/信息的日期。
我的目标是能够阅读所有的病理/临床信息,为一个特定的ID在一排。

通过对ID进行排序,我可以清楚地了解输入的每个ID的数量。当有几个带有相同ID的报告=多个行时,就会出现这个问题,因为这个报告中的日期与多个ID=行的日期不匹配。数据来源于病理学(样本日期、回答日期、临床资料日期等)。一名病人的病理和临床数据不一定要在当天准确匹配,但仍要在合理的时间框架内,例如在1-2个月内。最好用一个例子来说明这一点。
我想对列进行排序,以便从特定的行匹配到一起。我相信这是有办法的,但我想不出来。
提前感谢
发布于 2020-07-07 22:44:28
当两个单独的表合并为一个表时,似乎出现了不匹配记录的问题。为了解决这个问题,您可以选择以下几个选项:
ID进行合并,而是查看是否还有其他字段可以轻松地连接记录,比如medical record #、case #或event #,并根据这个新字段和ID合并表。这将是最强大的解决方案,但是,只有当您能够找到上述字段来增强link.时,它才能工作。
Sort -> Add Level来添加多个级别的排序。您可以更改数据排序的顺序(首先按ID排序,然后按ID排序)。https://stackoverflow.com/questions/62783963
复制相似问题