我会尽量保持简单。我有一个包含50407行和422列的数据集。在这50k行中,我搜索了一些数据点,总共有346行和422列。我想要识别这346行。所以我添加了一个名为MODE的新列,然后放入A,之后我有346行和423列。然后,我想用新的列模式将第347行添加回50407行。
maindata <- data.frame(main_set)
cutdata <- data.frame(cut_set)
data_set <- rbind(maindata, cutdata)
add_data <- unique(data_set)当我这样做时,正如你可能猜到的那样,因为有了新的列,现在所有列都是唯一的,所以数据不会被剪切。
所以我不知道现在该怎么做。尽你所能提供帮助。
example main
column0|column1|column2|column3|MODE
4 | 83 | 23 | 863 | B
53 | 26 | 9 | 153 | B
33 | 66 | 91 | 693 | B
6 | 87 | 27 | 863 | B
57 | 27 | 9 | 153 | B
37 | 67 | 97 | 693 | B
example cut
column0|column1|column2|column3|MODE
6 | 87 | 27 | 863 | A
57 | 27 | 9 | 153 | A
37 | 67 | 97 | 693 | A
rbind
column0|column1|column2|column3|MODE
4 | 83 | 23 | 863 | B
53 | 26 | 9 | 153 | B
33 | 66 | 91 | 693 | B
6 | 87 | 27 | 863 | B
57 | 27 | 9 | 153 | B
37 | 67 | 97 | 693 | B
6 | 87 | 27 | 863 | A
57 | 27 | 9 | 153 | A
37 | 67 | 97 | 693 | A点子答案
column0|column1|column2|column3|MODE
4 | 83 | 23 | 863 | B
53 | 26 | 9 | 153 | B
33 | 66 | 91 | 693 | B
6 | 87 | 27 | 863 | A
57 | 27 | 9 | 153 | A
37 | 67 | 97 | 693 | A发布于 2016-01-28 00:44:42
您可以使用dplyr来操作数据。假设你想根据汽车的气缸数和马力来标记mtcar中的汽车:
require(dplyr)
mtcars %>% group_by(cyl) %>% mutate(MODE = ifelse(hp > 180,"A","B")) %>% data.frame()这样,所有的汽车都按气缸编号分组,如果马力大于180,则标记为"A“,如果hp低于180,则标记为"B”。
https://stackoverflow.com/questions/35042876
复制相似问题