我试图运行一个顶点管道(自定义模型培训),我能够成功地运行在一个不同的项目。据我所知,所有的基础设施(服务帐户、桶等)都是一样的。
当我单击模型培训组件并读取以下内容时,错误将出现在管道UI中的灰色框中:
Retryable error reported. System is retrying.
com.google.cloud.ai.platform.common.errors.AiPlatformException: code=ABORTED, message=Specified Execution `etag`: `1662555654045` does not match server `etag`: `1662555533339`, cause=null System is retrying.我查看了日志资源管理器,发现错误日志是审计日志,与它们相关的标记如下:
protoPayload.methodName="google.cloud.aiplatform.internal.MetadataService.RefreshLineageSubgraph"
protoPayload.resourceName="projects/724306335858/locations/europe-west4/metadataStores/default
这让我觉得顶点元存储或者我的管道使用它的方式有问题。不过审计日志是自动的,所以我不确定。
我已经尝试过清除元数据存储并完全删除它。我还尝试过运行一个不同的模式培训管道,以前也在不同的项目中工作过,但没有运气。
发布于 2022-09-23 14:46:39
您得到的可还原错误是暂时的问题,问题现在解决了。
现在您可以重新运行管道,并且它不会进入无限重试循环。
https://stackoverflow.com/questions/73659986
复制相似问题