首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >关于预培训文本生成任务的问题,似乎预培训不是小模型的工作吗?

关于预培训文本生成任务的问题,似乎预培训不是小模型的工作吗?
EN

Data Science用户
提问于 2020-07-29 02:22:37
回答 1查看 21关注 0票数 0

我的任务是从句子中生成关键字。

我训练了一个文本生成模型。我掩盖了句子的标记,并预测了整个句子的标记。

预培训batch_size =8和step = 1000000

我还没有观察到训练前的进步。BLEU的成绩是10.5分,没有训练前的分数是10.5分,BLEU的成绩是9.5分。

我从

https://github.com/google-research/pegasus/blob/master/pegasus/models/transformer.py#L38

hidden_size = 512 num_encoder_layers =3 num_decoder_layers =3

讨论

任务是从句子中生成关键字。关键词可能不会出现在句子中。因此,输入掩码句子来预测整个句子,不利于关键词的生成任务。输入掩码句子来预测整个句子,与关键词生成任务无关。我说的对吗?这是训练前没有提高BLEU分数的原因吗?

非常感谢。

EN

回答 1

Data Science用户

回答已采纳

发布于 2020-08-19 04:12:18

1,我在多个句子的输入标记中放置了一些零。输出令牌的输出位置应该与输入令牌完全相同,这意味着我应该将填充零保留在输出令牌中。

2、训练前的时间应较长。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/78460

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档