首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >哪个SageMaker服务器支持服务器端批处理,以及如何启用它?

哪个SageMaker服务器支持服务器端批处理,以及如何启用它?
EN

Stack Overflow用户
提问于 2022-09-08 17:54:11
回答 1查看 31关注 0票数 0

MMS、TFServing和TorchServe支持服务器端的批处理(相应的请求可以由服务器以异步方式在本地批处理,同时对客户端保持同步批处理1大小的错觉)。如何在SageMaker端点上启用这些特性?

EN

回答 1

Stack Overflow用户

发布于 2022-09-15 18:36:44

对于每个SageMaker容器,可以通过环境变量来控制它们。

对于TorchServe:

代码语言:javascript
复制
from sagemaker.pytorch.model import PyTorchModel

env_variables_dict = {
    "SAGEMAKER_TS_BATCH_SIZE": "3",
    "SAGEMAKER_TS_MAX_BATCH_DELAY": "100000"
}

pytorch_model = PyTorchModel(
    model_data=model_artifact,
    role=role,
    image_uri=image_uri,
    source_dir="code",
    framework_version='1.9',
    entry_point="inference.py",
    env=env_variables_dict
)

工具包中的ENVs:https://github.com/aws/sagemaker-pytorch-inference-toolkit/blob/27b667fa27259dcea92b97e3dcc903057587deb6/src/sagemaker_pytorch_serving_container/ts_parameters.py

有关更多信息的博客文章:https://aws.amazon.com/blogs/machine-learning/optimize-your-inference-jobs-using-dynamic-batch-inference-with-torchserve-on-amazon-sagemaker/

TFServing批处理文档:https://github.com/aws/sagemaker-tensorflow-serving-container/blob/1bd309b7be5040d5515a3081fd5714e444b2ab91/README.md#enabling-batching

SageMaker目前不支持MMS批处理功能。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73653266

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档