首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >用硬盘代替Python中的RAM

用硬盘代替Python中的RAM
EN

Stack Overflow用户
提问于 2016-06-30 09:24:16
回答 2查看 5.9K关注 0票数 5

我想知道是否有一个方法或Python包可以让我使用大型数据集,而无需将其写入RAM中。

我还用熊猫做统计功能。

我需要访问整个数据集,因为许多统计函数都需要整个数据集来返回可信的结果。

我在Windows 10的LiClipse上使用LiClipse(连同解释器Python3.4)。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2016-06-30 09:33:40

您也可以使用标架达斯克来支持大型数据集,也可以使用熊猫和块进行读取/迭代,以尽量减少内存的使用。也值得一看熊熊

成批阅读:

代码语言:javascript
复制
chunksize = 10 ** 6
for chunk in pd.read_csv(filename, chunksize=chunksize):
process(chunk)
票数 2
EN

Stack Overflow用户

发布于 2016-06-30 09:37:03

如果您只需要将磁盘虚拟化为一个大型RAM内存,那么您可以在系统上设置一个交换文件。然后,内核将根据需要自动交换页面,使用启发式方法确定哪些页面应该交换,哪些应该留在磁盘上。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/38118942

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档