首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何在fairseq上运行教程:简单的LSTM

如何在fairseq上运行教程:简单的LSTM
EN

Stack Overflow用户
提问于 2020-11-25 04:20:57
回答 1查看 504关注 0票数 0

在尝试学习fairseq时,我遵循了网站上的教程并实现了:

https://fairseq.readthedocs.io/en/latest/tutorial_simple_lstm.html#training-the-model

然而,在执行完所有步骤之后,当我尝试使用以下内容训练模型时:

! fairseq-train data-bin/iwslt14.tokenized.de-en \ --arch tutorial_simple_lstm \ --encoder-dropout 0.2 --decoder-dropout 0.2 \ --optimizer adam --lr 0.005 --lr-shrink 0.5 \ --max-tokens 12000

我收到一个错误:

代码语言:javascript
复制
`fairseq-train: error: argument --arch/-a: invalid choice: 'tutorial_simple_lstm' (choose from 'fconv', 'fconv_iwslt_de_en', 'fconv_wmt_en_ro', 'fconv_wmt_en_de', 'fconv_wmt_en_fr', 'fconv_lm', 'fconv_lm_dauphin_wikitext103', 'fconv_lm_dauphin_gbw', 'transformer', 'transformer_iwslt_de_en', 'transformer_wmt_en_de', 'transformer_vaswani_wmt_en_de_big', 'transformer_vaswani_wmt_en_fr_big', 'transformer_wmt_en_de_big', 'transformer_wmt_en_de_big_t2t', 'bart_large', 'bart_base', 'mbart_large', 'mbart_base', 'mbart_base_wmt20', 'nonautoregressive_transformer', 'nonautoregressive_transformer_wmt_en_de', 'nacrf_transformer', 'iterative_nonautoregressive_transformer', 'iterative_nonautoregressive_transformer_wmt_en_de', 'cmlm_transformer', 'cmlm_transformer_wmt_en_de', 'levenshtein_transformer', 'levenshtein_transformer_wmt_en_de', 'levenshtein_transformer_vaswani_wmt_en_de_big',....

一些附加信息:我正在使用google colab。我正在编写整个代码,直到列车步入.py文件,并将其上传到fairseq/models/...路径按照我对指令的解释。我正在遵循链接中的确切教程。并且,在colab上运行它之前,我使用以下命令安装fairseq:

!git clone https://github.com/pytorch/fairseq %cd fairseq !pip install --editable ./

我认为这个错误的发生是因为按照教程创建的命令行参数没有正确设置。

有没有人可以解释一下,如果在任何一步,我需要做一些其他的事情。

对于初学者来说,我将非常感谢您的投入,因为来自社区的帮助对我很有帮助。

EN

回答 1

Stack Overflow用户

发布于 2020-12-09 15:54:48

看起来你没有注册SimpleLSTMModel架构,如下所示。一旦注册了模型,就可以将其与现有的命令行工具一起使用。

代码语言:javascript
复制
@register_model('simple_lstm')
class SimpleLSTMModel(FairseqEncoderDecoderModel):
...
.
.
...

请注意,复制.py文件并不意味着您已经注册了模型。为此,您需要执行包含上述代码行的.py文件。然后,您将能够使用现有的命令行工具运行训练过程。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64994231

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档