我在Stata工作,拥有一个电动车充电站的数据集。变量包括
充电站station_name名称
review_text由}{分隔的特定站点的所有客户评论
num_reviews客户评论的数量。
我正在尝试创建一个新文件,其中每个观察都表示一个新变量customer_review中的一个客户评审,而另一个变量station_id具有相应站点的名称。因此,如果原始数据集有100个观测(每个站点一个),每个站点有5个评论,那么新文件应该有500个观察。
我该怎么做?我会包括一些代码,我已经尝试过,但我不知道如何开始。
发布于 2022-03-17 00:18:02
如果您的数据如下所示:
station reviews n
1. 1 {good}{bad}{great} 3
2. 2 {poor}{excellent} 2 然后是:
split(reviews), parse(}{)
drop reviews n
reshape long reviews, i(station) j(review_num)
drop if reviews==""
replace reviews = subinstr(reviews, "}","",.)
replace reviews = subinstr(reviews, "{","",.)将产生:
station review~m reviews
1. 1 1 good
2. 1 2 bad
3. 1 3 great
4. 2 1 poor
5. 2 2 excellent https://stackoverflow.com/questions/71505539
复制相似问题