我有一个由两个合并的数据集组成的数据集。首先是来自国家统计局的官方失业数据,另一个是来自国际劳工组织模型估计的失业数据。
对于一些国家,如约旦,它被命名为JOR,但在另一个数据集中是JOR_total,尽管它正在衡量相同的人口群体。这导致同一年每个性别有两行。但是,我本质上希望为每个国家和每个性别保留一行。
下面是数据集的外观:
year gender country unemployment_official unemployment_ilo
2019 Female JOR 19
2019 Male JOR 8
2019 Female JOR_total 17.3
2019 Male JOR_total 7.4 我想要更改数据集,使其如下所示:
year gender country unemployment_official unemployment_ilo
2019 Female JOR 19 17.3
2019 Male JOR 8 7.4
2019 Female EGY 17 22
2019 Male EGY 5 9.4 发布于 2021-01-30 00:24:07
在合并两个数据集之前解决了这个问题,如下所示:
// Removing countries with duplicate entries
drop if country=="JOR"
replace country="JOR" if country=="JOR_total"看起来是这样的:
year gender country unemployment_official unemployment_ilo
2019 Female JOR 19 17.3
2019 Male JOR 8 7.4
2019 Female EGY 17 22
2019 Male EGY 5 9.4 https://stackoverflow.com/questions/65958007
复制相似问题