问合并2数据和内存错误
EN

Data Science用户

提问于 2019-02-14 02:26:19

回答 1查看 14.7K关注 0票数 3

试图将两个数据帧大小与(13647309，48)合并

我用了32块内存。

df_train = train.merge(train_lag,on=['ncodpers','int_date'], how='left')

在我运行这个程序之后，它需要太多的内存。

合并时是否有减少内存使用的方法？

pandas

kaggle

回答 1

Data Science用户

发布于 2019-08-08 08:30:50

问题是，当您合并两个数据文件时，您需要足够的内存来满足它们，再加上合并的内存。有一个stackoverflow回答的解决方案

您可以做的是只读取第一个数据(较小的数据)，然后分批读取第二个数据。

def preprocess(x):
    df = pd.merge(df_train, x, on=['ncodpers','int_date'], how='left')
    df.to_csv("final.csv", mode="a", header=False, index=False)

reader = pd.read_csv("train_lag.csv", chunksize=1000)

for r in reader:
    preprocess(r)

票数 2

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/45550

复制

相似问题

问合并2数据和内存错误
EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问合并2数据和内存错误EN

回答 1

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问合并2数据和内存错误
EN