我们希望强制在SageMaker培训作业(脚本模式下的XGBoost)上设置特定的安全组。但是,在这种情况下,分布式培训是无法开箱即用的,因为容器需要相互通信。我们需要为培训作业指定的最低入站/出站规则(端口)是什么,以便它们能够通信?
发布于 2022-09-10 18:36:59
在VPC中设置培训,包括指定安全组,在这里记录如下:
通常,您将允许培训节点之间的所有通信。为此,您可以将安全组源和目标指定到安全组本身的名称,并允许所有IPv4通信量。如果您想知道使用了哪些端口,可以: 1/定义允许的安全组。2/打开VPC流量日志3/运行训练。4/检查VPC流日志5/只将安全组更新到所需的端口。
我必须说,限制培训节点之间的通信可能是一个极端,所以我会向客户提出挑战,为什么真正需要它,因为所有节点都承担着相同的任务,具有相同的IAM角色,而且本质上是过渡的。
https://stackoverflow.com/questions/73663585
复制相似问题