首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R bigmemory不会读取大型csv文件

R bigmemory不会读取大型csv文件
EN

Stack Overflow用户
提问于 2016-05-29 13:53:01
回答 2查看 1.4K关注 0票数 0

我试图使用read.big.matrix从R biganalytics包以类似于大记忆的小片段的方式加载689.4 MB的csv。

小编法典:

代码语言:javascript
复制
library(bigmemory)
library(biganalytics)
x <- read.big.matrix("airline.csv", type="integer", header=TRUE,
        backingfile="airline.bin",
        descriptorfile="airline.desc",
        extraCols="Age")

根据42-的注释,我使用命令行cut -d, -f9,11,17,18,23 --complement 2008.csv > 2008cut.csv上的剪切删除了因子变量。

然后,我使用sed sed -i 's/NA/0/g' 2008cut.csv删除数据中的任何NA值,即使使用这些预处理步骤,我也会收到相同的错误。

我的代码:

代码语言:javascript
复制
#This works
x <- read.csv("~/Downloads/2008cut.csv",header=T)
dim(y)
#[1] 7009728      29
length(complete.cases(x))
#[1] 7009728

library(bigmemory)
library(biganalytics)
#This errors out
data <- read.big.matrix("~/Downloads/2008cut.csv", 
            type="integer", header=TRUE)

在尝试运行read.big.matrix时,我会收到以下错误:

代码语言:javascript
复制
Warning: stack imbalance in '.Call', 31 then 32
Warning: stack imbalance in '{', 28 then 29
Warning: stack imbalance in '-', 23 then 24
Warning: stack imbalance in '-', 22 then 23
Warning: stack imbalance in '<-', 20 then 21
Error in big.matrix(nrow = numRows, ncol = createCols, type = type,
 dimnames = list(rowNames,  : 
    A big.matrix must have at least one row and one column

我发现其他人有这个问题,但他们有混合数据相似问题,但没有反应。在我搜索的某个时候,邮件列表中的某个人询问用户是否可以运行类似x <- big.matrix(nrow=1000,ncol=10)的程序,以确保bigmemory在一般情况下正常工作。我am能够运行该代码并生成一个big.matrix。

任何指导都将不胜感激!

软件详细信息:

  • 数据:2008年档案
  • R: 3.2.3
  • 操作系统: x86_64-pc-linux-gnu
  • 重要记忆: 4.5.19
  • 双透析: 1.1.14
EN

回答 2

Stack Overflow用户

发布于 2016-05-29 14:17:46

对于读取大文件,我建议使用R data.table包中的data.table

票数 1
EN

Stack Overflow用户

发布于 2019-11-30 11:41:33

使用绝对路径:

代码语言:javascript
复制
absolutePath <- normalizePath("~/Downloads/2008cut.csv")

x <- read.big.matrix(absolutePath, type="integer", header=TRUE,
        backingfile="airline.bin",
        descriptorfile="airline.desc",
        extraCols="Age")
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/37510716

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档