我正在分析一个数据集,这是从老师那里得到的反馈。数据框中的每一行都是一个老师,他们的每个答案都是一个变量,但是我在输入每个老师的年份级别时遇到了一个问题,因为很多老师都教多个年级。
例如:
Teacher Year
a 1
b 3
c 1/2
d 7
e 3/4如何将这些数据输入到excel表格中,然后再输入到R中,并对其进行有用的分析?我以前从来没有处理过在同一行包含多个选项的变量。
发布于 2019-09-15 20:20:10
假设您已经在R中的一个名为teacher_data的对象中拥有此数据。我将向您展示处理这些我见过的最常用的响应的方法:创建额外的列,以便每个答案通过方便的tidyr函数separate()获得自己的单元格。
library(tidyr)
separate(teacher_data, col = "Year", into = paste0("Year", 1:2), sep = "/")结果如下:
Teacher Year1 Year2
1 a 1 <NA>
2 b 3 <NA>
3 c 1 2
4 d 7 <NA>
5 e 3 4然后,您如何使用这些列在某种程度上取决于您试图对数据提出什么样的答案。您的这部分问题最好在姊妹站点Cross Validated (Stack Exchange for statistics)上提出。
就Excel而言,我甚至不会将Excel作为中间步骤来处理;这是不必要的。如果在完成CSV操作后将数据写出,Excel可以很好地读取CSV:
write.csv(teacher_data, file = "teacher_data.csv", row.names = FALSE)另外,为了让您知道,我通过以下方式将您的数据放入R中:
teacher_data <- read.table(header = TRUE, stringsAsFactors = FALSE, text = "
Teacher Year
a 1
b 3
c 1/2
d 7
e 3/4")https://stackoverflow.com/questions/57943786
复制相似问题