首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >从S3加载新版本的模型时出现Tensorflow服务错误

从S3加载新版本的模型时出现Tensorflow服务错误
EN

Stack Overflow用户
提问于 2019-07-18 18:04:07
回答 1查看 254关注 0票数 1

我通过在K8S集群中使用专用部署的TF服务来为TF模型提供服务。我正在使用一个部署在与TF Serving相同的名称空间中的MinIO实例。

我使用以下环境变量对其进行了配置,以便让TF Serving访问S3并同步适当的文件

代码语言:javascript
复制
        - name: MODEL_NAME
          value: model-name
        - name: S3_ENDPOINT
          value: minio:9000
        - name: S3_USE_HTTPS
          value: '0'
        - name: S3_VERIFY_SSL
          value: '0'
        - name: AWS_REGION
          value: 'us-west-1'
        - name: AWS_ACCESS_KEY_ID
          valueFrom:
            secretKeyRef:
              key: AWS_ACCESS_KEY_ID
              name: minio-secret
        - name: AWS_SECRET_ACCESS_KEY
          valueFrom:
            secretKeyRef:
              key: AWS_SECRET_ACCESS_KEY
              name: minio-secret
        - name: MODEL_BASE_PATH
          value: s3://ROOT-BUCKET
        - name: TF_CPP_MIN_LOG_LEVEL
          value: '2'

一切都很顺利,我已经能够正确地查询服务器和预测,但当我加载一个新版本时,我总是得到以下错误:

代码语言:javascript
复制
'{ "error": "Failed to process element: 0 key: decoder_state_input_h:0 of \\\'instances\\\' list. Error: Invalid argument: JSON object: does not have named input: decoder_state_input_h:0" }'

终止POD (也称为重新启动TF服务),会导致新版本的正确恢复。此问题似乎是由于同步问题造成的,其中TF服务甚至在S3同步完成之前就开始加载可服务对象。

有什么线索吗?谢谢!

EN

回答 1

Stack Overflow用户

发布于 2020-12-09 16:23:45

当你的新模型版本有变量时可能会发生。参考:https://github.com/tensorflow/serving/issues/1086

尝试先上传变量dir。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57092002

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档