我正在将加载到H2O中(使用Python)来构建机器学习模型。有人向我建议,我应该分配一个H2O集群,其大小与我将要培训的框架大小的2-4倍,这样分析就可以轻松地在内存中使用。但我不知道如何精确估计H2O帧的大小。
因此,假设我已经将一个H2O框架加载到Python中,那么如何确定它的大小(以字节为单位)?在10-20%范围内近似是很好的。
发布于 2017-03-27 16:11:47
这指的是磁盘上文件大小的2-4倍,所以不要看Python中的内存,而是查看原始文件大小。此外,2-4x的推荐也因算法不同而不同(GLM & DL将比基于树的模型需要更少的内存)。
https://stackoverflow.com/questions/43048126
复制相似问题