我正在研究国家和行业因素的影响(例如:GDP,进口,出口)对工资差异的影响。我收集了5年来75个国家、19个行业的行业数据,并试图使用固定效应模型进行分析。
我想知道如何使用R将数据集识别为各个国家和时间的面板数据。我了解到以下代码将用于Stata。R也有类似的代码吗?
egen country_industry = group(country industry)
xtset country_industry time我尝试在R中使用以下代码,但它不起作用:
library(plm)
panel8 =pdata.frame(sampledata7_industry, index=c("id","industry","year"))错误码如下:
> library(plm)
> panel8 =pdata.frame(sampledata7_industry, index=c("id","industry","year"))
Warning message:
In pdata.frame(sampledata7_industry, index = c("id", "industry", :
duplicate couples (id-time) in resulting pdata.frame
to find out which, use, e.g., table(index(your_pdataframe), useNA = "ifany")我的数据的前几行如下:sampledata7_industry
我应该重新编号ID以结合国家和行业吗?其中一个想法如下:
发布于 2021-11-11 16:26:40
我认为问题在于,在Stata中,您的分组变量是国家-行业,而在R中,您试图对两个变量进行分组,国家和行业。根据pdata.frame的文档:
参数指示面板的尺寸。它可以是:
·包含个人名称和时间索引的两个字符串的向量
因此,如果您像在Stata中那样将'id‘和’行业‘组合为一个变量,那么它应该会起作用。
https://stackoverflow.com/questions/69930371
复制相似问题