我们正在为databricks集群开发自定义运行时。我们需要对集群进行版本化和存档,以供客户使用。我们在我们自己的环境中成功地运行了它,但是我们无法使它在客户端的环境中工作。这是一家有很多限制的大公司。
我们可以启动EC2实例并提取映像,但是还必须有其他一些阻止程序。我认为ec2实例正在成功地运行,但我在databricks中有错误
集群terminated.Reason:Container发射失败
在集群的员工实例上启动容器时,遇到了一个意外错误。如果问题仍然存在,请重试并与Databricks联系。
实例ID: I-0fb506538453fdf
内部错误消息:在实例i-0fb50653895453fdf上启动火花容器失败。异常:容器设置超时了
它应该在客户端环境中的某些设置/权限中。
下面是ec2日志的结尾
-端SSH主机密钥上升17.38秒。59.877016云-init 1705:云-init诉21.4-0 ubuntu1~18.04.1在Wed完成,2022年3月9日15:06:13 +0000。数据源DataSourceEc2Local。上升59.86秒59.819059审核: kauditd持有队列溢出
66.068641审计: kauditd保持队列溢出66.070755审计: kauditd保持队列溢出66.072833审计: kauditd保持队列溢出74.733249审计: kauditd保持队列溢出
74.735227审计: kauditd保持队列溢出74.737109审计: kauditd保持队列溢出79.899966审计: kauditd保持队列溢出79.903557审计: kauditd保持队列溢出
79.907108审计: kauditd保持队列溢出89.324990审计: kauditd保持队列溢出89.324990审计: kauditd持有队列溢出仲裁审计: kauditd保持队列溢出106.617320审计: kauditd保持队列溢出106.620980审计审计: kauditd保持队列溢出溢出107.464865审计: kauditd保持队列溢出溢出127.175767审计: kauditd保持队列溢出127.179897审计: kauditd保持队列溢出127.215281审计: kauditd保持队列溢出132.190357审计: kauditd保持队列溢出132.193968审核: kauditd保持队列溢出132.193968审核:kauditd保持队列溢出127.179897审计:kauditd保持队列溢出132.190357审计:kauditd保持队列溢出132.193968审核:kauditd保持队列溢出127.179897审计:kauditd保持队列溢出132.190357审计:kauditd保持队列溢出132.193968审计:kauditd保持队列溢出127.179897审计:kauditd保持队列溢出132.190357审计:kauditd保持队列溢出132.193968审核:kauditd保持队列溢出127.179897审计:kauditd保持队列溢出132.190357审计:kauditd保持队列溢出132.193968审计: kauditd持有队列溢出156.211713审计: kauditd保持队列溢出156.215388审计: kauditd保持队列溢出228.558571审计: kauditd保持队列溢出228.562120审计: kauditd保持队列溢出228.565629审计: kauditd保持队列溢出316.405562审计: kauditd保持队列溢出316.409136审计: kauditd保持队列溢出
发布于 2022-05-04 01:53:51
这通常是由于下载自定义码头映像的速度慢造成的,请检查是否可以从启动VM的网络上正确地从坞库下载。
https://stackoverflow.com/questions/71419465
复制相似问题