首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >对于SageMaker异步推理端点,我需要什么AWS配额才能进行扩展?

对于SageMaker异步推理端点,我需要什么AWS配额才能进行扩展?
EN

Stack Overflow用户
提问于 2022-08-08 12:42:56
回答 1查看 109关注 0票数 0

我想使用异步推理端点来部署一个模型,该端点将自动缩放。但是,我找不到关于在不耗尽资源的情况下工作所需的配额的信息。

缩放是否需要某种特定类型的配额,以便可以在推理容器的不同实例上并行执行多个作业?

文档中并不清楚配额是否适用于异步推理端点。显然,它们适用于实时推理端点,但是异步推理文档似乎根本没有提到它.

EN

回答 1

Stack Overflow用户

发布于 2022-08-12 16:36:32

带有异步端点的AutoScaling与其他推理选项的自动标度没有什么不同,即您的AWS配额需要反映您希望缩放到的实例的正确数量。例如,如果在如下所示的异步自动标度配置中配置min和最大实例计数,则需要有5个可用实例供您使用。[ 参考文献 ]

代码语言:javascript
复制
response = client.register_scalable_target(
    ServiceNamespace='sagemaker', 
    ResourceId=resource_id,
    ScalableDimension='sagemaker:variant:DesiredInstanceCount', # The number of EC2 instances for your Amazon SageMaker model endpoint variant.
    MinCapacity=0,
    MaxCapacity=5
)

注-我在AWS SageMaker工作,但我的意见是我自己的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73278085

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档