我正在尝试使用.dat命令从internet导入一个数据集。当文件被格式化时,我通常没有问题,例如:
A B
1 2
3 4但是这个数据集是格式化的。
A B A B
1 2 3 4
5 6 7 8(您可以找到我在这里遇到问题的数据集:https://www2.isye.gatech.edu/~jeffwu/book/data/BrainandBodyWeight.dat)
我目前的代码是:
Data2 = read.table("https://www2.isye.gatech.edu/~jeffwu/book/data/BrainandBodyWeight.dat", header = TRUE)我得到的错误是:
扫描中的
错误(文件=文件,什么=什么,sep =9月,引号=引号,dec = dec,:第1行没有12个元素
发布于 2021-02-04 03:00:45
问题是标题行中有空格,所以只需使用skip = 1跳过。
在那里,我们可以使用重复的逻辑向量c(TRUE, FALSE)和c(FALSE, TRUE)提取奇偶行。
数据的最后一行有一些空值,所以用complete.cases()删除那些值。
data <- read.table("https://www2.isye.gatech.edu/~jeffwu/book/data/BrainandBodyWeight.dat",
header = FALSE, fill = TRUE, skip = 1)
result <- data.frame(Body.Wt = unname(unlist(data[,c(T,F)])),
Brain.Wt = unname(unlist(data[,c(F,T)])))
result <- result[complete.cases(result),]
head(result)
Body.Wt Brain.Wt
1 3.385 44.5
2 0.480 15.5
3 1.350 8.1
4 465.000 423.0
5 36.330 119.5
6 27.660 115.0https://stackoverflow.com/questions/66038640
复制相似问题