首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >使用没有内存约束的R/Python将SAS文件(sas7bdat)转换为平面文件

使用没有内存约束的R/Python将SAS文件(sas7bdat)转换为平面文件
EN

Stack Overflow用户
提问于 2018-07-03 14:07:04
回答 1查看 1.6K关注 0票数 0

我需要将SAS文件转换为平面文件。这些文件可能相当大,可以高达60 GB的大小。我用R(下面)编写了一个脚本,但是它读取整个数据,然后导出到CSV文件。有没有办法在没有任何内存限制的情况下转换这么大的文件。我愿意使用R或Python。我在一台有16 GB内存的机器上工作。

代码语言:javascript
复制
args = commandArgs(trailingOnly=TRUE)

library(sas7bdat)

MyData <-  read.sas7bdat(file = args[1])
write.csv(MyData, file = args[2], row.names = FALSE)
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-07-09 06:53:15

在我看来,您可以使用pandas.read_sas和块状arg提供解决方案:

熊猫读sas文档

例如,迭代10k观测:

代码语言:javascript
复制
import pandas as pd

chunk_size =  10**4
for chunk in pd.read_sas(filename, chunksize=chunksize):
    process(chunk)

其中process()是您希望提供的指令(附加等)。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51156674

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档