我正在一个蔚蓝的集群上运行R包h2o版本3.20.0.2。
在对许多h2o模型进行拟合之后,h2o集群似乎对此错误消息没有响应:
.h2o.__checkConnectionHealth():H2O集群节点127.0.0.1:54321中的警告动作缓慢,应该手动检查。
我试图用h2o.shutdown()重置集群,但是问题仍然存在,h2o.init()失败了。没有管理员权限,我如何才能真正重新启动h2o服务器,以及今后如何避免这个问题?
发布于 2018-09-20 13:55:18
最常见的原因是您已经使用了集群中的所有内存。
选项包括做以下事情:
h2o.shutdown()使用对后端的api调用来执行协作关闭,但是如果后端已经处于糟糕的状态,则可能无法工作。
如果您在与H2O服务器相同的主机上运行R,则可以在R中执行系统(“ps-ef”)之类的操作来运行linux命令,并尝试以这种方式修复它,即使没有直接的终端提示。找到h2o java进程并终止它。
https://stackoverflow.com/questions/52424067
复制相似问题