我通过AI Platform UI创建了一个使用全局端点的模型。我正在尝试部署使用保存的模型生成器导出的基本tensorflow 1.15.0模型。当我试图部署这个模型时,我在UI中得到了一个Create Version Failed. Bad model detected with error: "Error loading the model"错误,我在日志中看到了以下内容:
ERROR:root:Failed to import GA GRPC module. This is OK if the runtime version is 1.x
Failure: Could not reach metadata service: Internal Server Error.
ERROR:root:Command '['/tools/google-cloud-sdk/bin/gsutil', '-o', 'GoogleCompute:service_account=default', 'cp', '-R', 'gs://cml-365057443918-1608667078774578/models/xsqr_global/v6/7349456410861999293/model/*', '/tmp/model/0001']' returned non-zero exit status 1.
ERROR:root:Error loading model: 'generator' object has no attribute 'next'
ERROR:root:Error loading the model奇怪的是,gcloud ai-platform local predict可以正确地处理这个导出的模型,而且我可以在没有问题的区域端点上部署这个完全相同的模型。只有当我尝试使用全局端点模型时,它才会出现此错误。但是我需要全局端点,因为我计划使用一个自定义预测例程(如果我能让这个基本模型首先工作)。
日志似乎暗示了从存储中复制模型的问题?我尝试给各种IAM角色额外的查看器权限,但我仍然会遇到相同的错误。
谢谢你的帮助。
发布于 2021-01-09 00:50:24
我想这是和https://issuetracker.google.com/issues/175316320一样的问题
该问题上的评论称,目前正在推出修复方案。
发布于 2022-05-16 11:26:40
今天,我遇到了同样的错误(错误:(gcloud.ai-platform.versions.create)创建版本失败。错误检测到的错误模型:“错误加载模型”)&对于那些想要摘要的人:
建议通过区域端点(例如:us-central1 1)使用n1*机器类型(例如: n1-standard-4),而不是在部署版本时使用mls1 1*机器。此外,在使用下面的命令创建模型本身时,我确保提到了相同的区域( using 1),从而解决了上面提到的错误。
!gcloud ai-平台模型创建$model_name
--区域=$REGION
https://stackoverflow.com/questions/65419103
复制相似问题