首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何运行大型feather R数据库

如何运行大型feather R数据库
EN

Stack Overflow用户
提问于 2021-10-25 23:49:12
回答 1查看 59关注 0票数 3

我正在尝试使用下面的代码将一个4 8GB的数据库(大约9,000,000个obs和100个变量)导入到使用windows 10和8 8GB的R中

代码语言:javascript
复制
library(feather)
memory.limit(size=99999)

rais_transp = read_feather('rais_transp.feather')

但每次我尝试运行它时,都会收到以下错误消息

代码语言:javascript
复制
"r encountered a fatal error: the session was terminated"

我尝试只下载一个列,但仍然收到相同的消息,会话重新启动

代码语言:javascript
复制
rais_transp = read_feather('rais_transp.feather', columns=c('black'))

我曾经可以在我的计算机上处理这个数据库,但现在我不能再运行它了。

有人来帮我吗?

谢谢

EN

回答 1

Stack Overflow用户

发布于 2021-10-29 18:48:24

我在使用.csv时遇到了类似的问题,我遵循了下面的步骤:

当你使用windows的时候,你应该安装cygwin来预处理这个文件。安装后,您可以使用cygwin shell将您的文件拆分成较小的块,并在上面写入:

代码语言:javascript
复制
split -b100m rais_transp.csv

正如danh指出的那样,您必须将其转换为csv。命令-b100m意味着您的新文件块将具有100MB的大小。至于羽化大小比csv文件小,也许你需要做更小的块。例如,您可以使用-b 1024k获取1MB的区块。

您可以在Efficient R Programming一书的第5.3.2和6.6点中找到相关的有用信息。

在这里你可以找到检查这一点的链接:https://csgillespie.github.io/efficientR/data-carpentry.html#working-with-databases

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/69715947

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档