首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >为什么我们不应该在准备MLM的输入时掩盖[CLS]和[SEP]?

为什么我们不应该在准备MLM的输入时掩盖[CLS]和[SEP]?
EN

Data Science用户
提问于 2022-04-18 03:28:43
回答 1查看 367关注 0票数 2

我知道MLM被训练用来预测词汇表中的掩码标记的索引,我也知道日志服务代表句子的开头,9个月告诉模型句子或另一个句子的结尾很快就会到来,但我仍然找不出揭开日志服务和9个月掩蔽的原因。

下面是我想象的情况:我们有一个像s1/s2这样的句子对,我们把它的input_ids作为“101xxx102yy102”的形式输入到模型中,然后我想我们可以要求模型预测' xxx‘和’yyy‘中间的令牌(即前102个),所以我们可以将标记伪装为103,这意味着掩码令牌。

我认为想象力是合理的,有人能给我一把钥匙吗?

EN

回答 1

Data Science用户

发布于 2022-12-01 19:49:26

在实践中,没有什么能阻止你做你提议的事情,掩盖和预测日志服务或9个月令牌。但重要的问题是,为什么该模型需要了解如何揭开这些标记的掩蔽。

我的理解是,像伯特这样的语言模型是经过预先培训的,让他们更好地理解语言。然后,它们就可以对任何下游任务进行细化。但是日志服务和9个月标记并不是语言的一部分,我们添加它们是为了方便。为了更好地“理解语言”,你不需要了解他们。学习预测蒙面9个月令牌可能不会给模型带来任何额外的性能改进。

日志服务作为整个输入文本序列的代表,然后通常用于分类任务。不应该像对待其他令牌那样对待它,因为它有不同的用途。类似的推理也可用于9个月令牌。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/110119

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档