
当我构建一个自动生成源代码注释的深度学习模型时。我得到了上面的错误。我使用了转换器模型来创建model.Can,谁能给我一个解决方案
发布于 2021-06-03 03:41:09
您似乎正在使用transformers模块。根据文档,提供参数的顺序为:
def __init__(
self,
vocab_size=267735,
cutoffs=[20000, 40000, 200000],
d_model=1024,
d_embed=1024,
n_head=16,
d_head=64,
d_inner=4096,
div_val=4,
pre_lnorm=False,
n_layer=18,
mem_len=1600,
clamp_len=1000,
same_length=True,
proj_share_all_but_first=True,
attn_type=0,
sample_softmax=-1,
adaptive=True,
dropout=0.1,
dropatt=0.0,
untie_r=True,
init="normal",
init_range=0.01,
proj_init_std=0.01,
init_std=0.02,
layer_norm_epsilon=1e-5,
eos_token_id=0,
**kwargs
)因为您没有为构造函数提供正确的名称,所以它将n_x_vocab关联到vocab_size,将n_y_vocab关联到cutoffs。因此,所需的参数n_head、d_inner、n_layer和d_head被认为是缺少的。
一旦您以适当的顺序提供了参数和/或显式地命名了参数,就像您在d_model = 256中所做的那样,这个错误应该被修复。
https://stackoverflow.com/questions/67811224
复制相似问题