我正在尝试遵循谷歌云TPU训练模型的官方教程。这是教程:https://cloud.google.com/tpu/docs/tutorials/transformer-pytorch
在“启动Cloud TPU资源”步骤中,我执行以下操作
:~$ gcloud compute tpus create train-bert-one \
> --zone=europe-west4-a \
> --network=default \
> --version=pytorch-1.6 \
> --accelerator-type=v3-8就像在教程中一样,我只是调整了区域。
命令失败,出现以下错误
ERROR: (gcloud.compute.tpus.create) PERMISSION_DENIED: Permission 'tpu.nodes.create' denied on 'projects/bert-archaea-fine-tuning/locations/europe-west4-a/nodes/train-bert-one'有人知道这个错误吗?在上面找不到任何东西。
发布于 2020-10-06 20:44:54
Google Support能够解决这个问题,问题是由于某些原因,在创建项目时没有自动创建可用的API服务帐户
gcloud compute --project=${PROJECT_ID} instances create transformer-tutorial \
--zone=us-central1-a \
--machine-type=n1-standard-16 \
--image-family=torch-xla \
--image-project=ml-images \
--boot-disk-size=200GB \
--scopes=https://www.googleapis.com/auth/cloud-platform已通过将标志--service-account=添加到命令并手动指定要使用的服务帐户修复。
https://stackoverflow.com/questions/64224796
复制相似问题