我正在使用火把闪电,以细化t5变压器在一个特定的任务。然而,我无法理解这是如何进行的。我总是看到这样的代码:
tokenizer = AutoTokenizer.from_pretrained(hparams.model_name_or_path) model = AutoModelForSeq2SeqLM.from_pretrained(hparams.model_name_or_path)
我不明白制作是如何完成的,它们是冻结整个模型并只训练头部(如果是的话,我如何更改头部),还是使用预先训练过的模型作为权重初始化?我已经找了好几天了。任何链接或帮助都将不胜感激。
https://stackoverflow.com/questions/71781813
复制相似问题