如何删除在列x中出现的重复项,而不能删除y列中出现的重复项?
我的数据集如下:
+-------+---+---+
| year | x | y |
+-------+---+---+
| 2001 | 1 | 2 |
| 2001 | 2 | 3 |
| 2001 | 2 | 3 |
| 2001 | 4 | 6 |
| 2001 | 5 | 9 |
| 2001 | 4 | 2 |
| 2001 | 4 | 9 |
+-------+---+---+我想要的是从x列中删除y列中的条目,结果是: 1,4,5
我目前正在学习Stata,如果存在这种情况,我很想知道所有可能的命令的良好来源?这样我自己就能学得更好。目前我很难找到好的资料来源。
发布于 2017-01-31 22:45:01
在Stata中,您所称的列总是被称为变量。
有关如何在Stata问题中显示数据示例的一般建议,请参见http://www.statalist.org/forums/help#stata。(代码分隔符上的注释在这里不适用。)
这可能会有帮助。我不明白year在你的问题中扮演的角色。
clear
input year x y
2001 1 2
2001 2 3
2001 2 3
2001 4 6
2001 5 9
2001 4 2
2001 4 9
end
rename x Datax
rename y Datay
gen long obs = _n
reshape long Data, i(obs) j(which) string
bysort Data (which) : drop if which[_N] == "y"
list
+---------------------------+
| obs which year Data |
|---------------------------|
1. | 1 x 2001 1 |
2. | 4 x 2001 4 |
3. | 7 x 2001 4 |
4. | 6 x 2001 4 |
5. | 5 x 2001 5 |
+---------------------------+所有可能的命令都不是在一个地方记录下来的。有人可以随时编写新命令,除了帮助文件之外,其他地方都不会记录这些命令。你是认真的吗?也不是所有现有的命令都记录在一个地方:许多命令是用户编写的,其中大多数只是通过帮助文件来记录的。
大多数由提供的官方命令()都记录在手册中。从字面上讲,还有一些无文档的命令(我没有发明这个:参见help undocumented),也有一些无文档的命令存在,因为StataCorp在谈话或电子邮件中提到了这些命令。要尽可能积极:从手册开始,将Stata的副本捆绑为.pdf文件。
https://stackoverflow.com/questions/41968275
复制相似问题