我使用read.csv2将数据读取到R数据框中。对于我的一个数据集,以某种方式将一些变量放入下一行,创建额外的行并剪切列。例如:我的CSV看起来像这样:
var1,var2,var3
value1,value2,value3
value1,value2,value3然而,数据框结果如下所示:
var1 var2
value1 value2
value3
value1 value2
value3我在很多CSV文件上使用了相同的命令,即使是在具有完全相同文件的不同样本的文件上也是如此,但从未遇到过这个问题。有谁知道这是什么原因造成的吗?
编辑:由于我仍然不确定如何上传实际的数据集,我已经上传了一个屏幕截图,看看它是什么样子。拆分发生在超过3列的每一行中。

发布于 2020-02-13 22:54:14
在您的数据中,整个文件的列数不相等,因此您不能简单地使用read.csv,而必须将read.table与fill=TRUE一起使用。在col.name中填充适当数量的列名,以反映您的数据结构。从你的截图看,至少有6列。
read.table(dat, header = FALSE, sep = ",",
col.names = c("col_name1", "col_name2", "col_name3"), fill = TRUE)有关更多信息,请参阅此answer。
发布于 2020-02-14 23:27:38
谢谢@jyr!这是完全有意义的,到目前为止,它工作得很好。有没有办法让R检测到实际需要的列数?
https://stackoverflow.com/questions/60150843
复制相似问题