首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >合并2数据和内存错误

合并2数据和内存错误
EN

Data Science用户
提问于 2019-02-14 02:26:19
回答 1查看 14.7K关注 0票数 3

试图将两个数据帧大小与(13647309,48)合并

我用了32块内存。

代码语言:javascript
复制
df_train = train.merge(train_lag,on=['ncodpers','int_date'], how='left')

在我运行这个程序之后,它需要太多的内存。

合并时是否有减少内存使用的方法?

EN

回答 1

Data Science用户

发布于 2019-08-08 08:30:50

问题是,当您合并两个数据文件时,您需要足够的内存来满足它们,再加上合并的内存。有一个stackoverflow回答的解决方案

您可以做的是只读取第一个数据(较小的数据),然后分批读取第二个数据。

代码语言:javascript
复制
def preprocess(x):
    df = pd.merge(df_train, x, on=['ncodpers','int_date'], how='left')
    df.to_csv("final.csv", mode="a", header=False, index=False)

reader = pd.read_csv("train_lag.csv", chunksize=1000)

for r in reader:
    preprocess(r) 
票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/45550

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档