我正在尝试使用T5来训练一个simpletransformers模型。这是我的代码:
from simpletransformers.t5 import T5Model
model_args = {
"max_seq_length": MAX_LEN,
"train_batch_size": 8,
"eval_batch_size": 8,
"num_train_epochs": 1,
"evaluate_during_training": True,
"evaluate_during_training_steps": 15000,
"evaluate_during_training_verbose": True,
"learning_rate": 1e-4,
"evaluate_generated_text": True,
"use_multiprocessing": False,
"fp16": False,
"use_cuda":False,
"save_steps": -1,
"save_eval_checkpoints": False,
"save_model_every_epoch": False,
"reprocess_input_data": True,
"overwrite_output_dir": True,
"wandb_project": None
}
model = T5Model('t5', 't5-base', args=model_args)但是我发现了一个错误:
ValueError: 'use_cuda' set to True when cuda is unavailable.Make sure CUDA is available or set `use_cuda=False`.我已经指定了use_cuda=False和fp16 =False,不知道为什么会出现这个错误。我正在木星上运行我的代码,我尝试重新启动内核并重新运行代码,但是没有希望。
发布于 2022-10-20 11:37:51
您需要将arg use_cuda传递给对T5Model构造函数的调用,而不是在model_args dict中传递。
from simpletransformers.t5 import T5Model
model_args = {...}
model = T5Model('t5', 't5-base', args=model_args, use_cuda=False)https://stackoverflow.com/questions/74138756
复制相似问题